Was macht diese RegExe?

(?:http://(?:(?:(?:(?:(?:a-zA-Zd?). )(?:a-zA-Z?))|(?:(?:d+)(?:.(?:d+) ){3}))(?::(?:d+))?)(?:/(?:(?:(?:(?:[a-zA-Zd$-.+!'(),]|(?:%[a-fA-F d]{2}))|[;:@&=]))(?:/(?:(?:(?:[a-zA-Zd$-.+!'(),]|(?:%[a-fA-Fd]{ 2}))|[;:@&=]))))(?:?(?:(?:(?:[a-zA-Zd$-.+!'(),]|(?:%[a-fA-Fd]{ 2}))|[;:@&=])))?)?)|(?:ftp://(?:(?:(?:(?:(?:[a-zA-Zd$-.+!'(),]|(? :%[a-fA-Fd]{2}))|[;?&=]))(?::(?:(?:(?:[a-zA-Zd$-_.+!'(),]|(?:%[a- fA-Fd]{2}))|[;?&=])))?@)?(?:(?:(?:(?:(?:a-zA-Zd?).)* (...)

Weiterlesen

wikipedia2bibtex

Hier ein kleines Python-Script um aus einem Wikipedia-Artikel einen BibTex-Eintrag zu generieren.

Known Issues

  • Leider habe ich noch keine schöne Variane gefunden das Artikel Jahr rauszufinden. Deswegen wird immer das aktuelle Jahr gesetzt.
  • Als Key des BibTex-Eintrags wird immer der seitenspezifische URL Abschnitt genommen. Dabei kann es zu Problemen kommen wenn Sonderzeichen o. ä. benutzt werden.
import sys
import urllib.request
from bs4 import BeautifulSoup
import time
import re

urlstring = sys.argv[1];
print('try to retrieve "%s"...' % urlstring)

try:
 req = urllib.request.Request(urlstring, headers={'User-Agent' : "Magic Browser"})
 with urllib.request.urlopen(req) as url:
 wikisite = url.read()
except ValueError:
 sys.stderr.write('unkown url type "%s"n' % urlstring)
 sys.exit(1)

soup = BeautifulSoup(wikisite)
label = urlstring.rsplit('/',1)[1]
title = soup.title.string
title = title.split('–',1)[0]
title = title.split('-',1)[0]
year = time.strftime("%Y")
timestamp = time.strftime("%d.%m.%Y")

print('@misc{wiki:%s,ntauthor = "Wikipedia",nttitle = "%s--- {W}ikipedia", ntyear = "%s", nthowpublished = "%s", ntnote = "[Online; accessed %s]"n}' % (label, title, year, urlstring, timestamp))

Datenfresser

Pacman frisst und frisst und frisst... Nachdem ich es endlich geschafft habe das Buch „Die Datenfresser“ von Constanze Kurz und Frank Rieger zu lesen, kann ich nur noch mehr jeden dazu Aufrufen sich in Punkten Privatsphäre und Datenschutz weiterzubilden. Was die großen Firmen wie klein f und groß G gemeinsam mit Pacman haben ist der unendliche Hunger! Leider aber nicht nach gelben Punkten sondern nach Daten: Deinen Daten, vor allem im Kontext zu deiner Person. Die personalisierte Werbung ist ein Faktor warum persönlichen Profile, Nutzungsgewohnheiten und Kurznachrichten so wertvoll sind. Was daraus noch gewonnen werden kann bringt die Zeit.
Jeder sollte sich in Tagen in denen Face Recognition und Authentifizierung per Kreditkarte immer mehr Verbreitung findet ein eigenes Verständnis und Bewusstsein für seine persönliche Privatsphäre finden. Die bekannten Beispiele wie die Bilder vom letzten Abschuss auf der Uniparty der beim Bewerbungsgespräch auf dem Tisch liegt sind allen bekannt. Auch die Skandale über geographische Nutzerprofile bei Smartphones wurden überall durchgekaut. Doch trotzdem scheren sich viel zu wenig Menschen tatsächlich darum und geben sich den vermeintlich „kostenlosen“ Services hin – Das sind sie aber ganz gewiss nicht. Ein Blick ich so manche Datenschutz-Klauseln gibt die tatsächlichen Kosten preis. Meist verliert man seine Rechte an den Bildern, Texten oder Videos komplett und verliert damit die Kontrolle über jegliche weitere Verwendung auch wenn man den Dienst kündigen sollte.
Auf politischer Ebene tut sich in der Richtung recht wenig. Die Politik kommt auf nationaler Ebene wenig gegen International agierende Dienste an. Die staatliche Seite hat seid dem 11. September 2001 in Sachen Datenschutz ebenfalls stark auf die Bremse getreten. So wurden erst vor kurzem eine Verlängerung der Anti-Terror-Gesetze von unserer Justizministerin Fr. Leutheusser-Schnarrenberger gebilligt. Die Terrorgefahr ist nach wie vor der Grund. Ein bisschen mehr Kontrolle schadet ja nie!
Spannende und beängstigende Entwicklungen die bisher noch wenig Gegenwehr hervorrufen. Wahrscheinlich fehlt einfach der Grundstein dafür in breiten Teilen der Bevölkerung.

Die Frage ist:
Wie schafft man eine Sensibilisierung von genau solche Themen? Wie erreicht man einen Punkt in dem man unterscheiden kann welche Daten man tatsächlich Preisgeben will?
Wie erzeugt man das Bewusstsein für Privatsphäre?

Verschmutzung im Pfälzer Wald

Es ist eine Schande!
Diese Woche war ich mal wieder im heimischen Pfälzer Wald unterwegs. Leider musste ich mit Erschrecken feststellen wie vermüllt er stellenweise hinterlassen wird.  In so manchem Tal findet sich hinter fast jedem Baum Überreste von Windeln, Taschentüchern oder Verpackungen – Einfach traurig. Auch auf den Hütten nimmt das ganze kein Ende.

Als Beispiel der auf 516m gelegene Eckkopf. Von dem auf dem Eckkopf gelegenen Aussichtsturm hat man bei guten Wetter einen Ausblick über die Rheinebene bis zum Odenwald bzw. Schwarzwald. Auch viele andere „Erhebungen“ am Haardtrand sind gut sichtbar. So ist ohne Schwierigkeit das Weinbiet, die Kalmit und das Hambacher Schloss auszumachen.

Am Wochenende wird dort die auf dem Eckkopf gelegene Hütte von verschiedenen Vereinen bewirtschaftet; Unter der Woche scheint ich jeder eine eigene Wegzehr in fester als auch in flüssiger Form mitzubringen. Doch leider schafft es nicht jeder Besucher seinen produzierten Müll auch wieder zurück in den Rucksack zu packen. Somit kann man das Erlebnis Pfälzer Wald mit Blick auf leere Weinflaschen, Bierdosen oder anderen Überresten genießen.

Mein Appell an alle Dreckspatzen im Pfälzer Wald: Nehmt euer Zeug wieder mit!

 

Level up?

1up Mushroom Super Mario Seit einigen Tagen bin ich dabei aus meiner Dropbox auszuziehen. Als neues Heim für meine Daten, hauptsächlich für die Uni, habe ich mir eine Mischung aus SVN und git rausgesucht. Grund für diesen Umstieg ist die doch nicht ganz so automatische Synchronisation von Daten in der Dropbox. Problematisch wird es nämlich sobald man versucht Datensicherheit mit TrueCrypt Containern um zusetzen [1]
Prinzipiell hatte das ganze den verlockenden Aspekt, dass beim Abgleich mit dem Server trotz großen TrueCrypt Containern nur die wirklichen Veränderungen abgeglichen werden. Doch sobald man an verschiedenen Rechnern nicht immer Dropbox im Hintergrund laufend hat kommt es nicht allzu selten zu „conflicted-state“ Dateien, welche Dropbox dann wieder anfängt komplett zu synchronisieren. Dass das bei großen Containern um die ein Gigabyte anstrengend wird kann man sich vorstellen.
Der Auslöser für den Umstieg war dann letztendlich der Dienst Assembla welcher zum einen kostenlosen SVN als auch git Support mit zwei Gigabyte Speicherplatz bietet. Ob sich diese manuelle Synchronisation über ein Versionskontrollsystem besser eignet um die an der Uni anfallenden Projekte und andere Daten auf allen Rechnern auf dem gleichen Stand zu halten wird sich zeigen.
Ein Vorteil den ich jetzt gleich zu Anfang gefunden habe, war die Möglichkeit das Repository einer meiner Vorlesungen (Softwaretechnik I) als „svn:externals“ in mein eigenes einzubinden. Somit bewirkt ein Update meiner Dateien gleichzeitig ein Update der vorlesungsrelevanten Daten. Klick gespart 🙂

Zum Thema git kann ich bis jetzt das Buch „Git kurz & gut“ von Sven Riedel (O’Reilly Verlag) empfehlen, in dem habe ich bis her alles gefunden was ich für den Anfang benötigt habe.

Wer prinzipiell einen Einblick in Versionskontrolle, vorallem im verteilten Sinne wie git sucht wird beim CRE130 fündig.