Kurs:Open Government und Open Data (HdM 2022)/Stuttgart goes Wikimedia

Projektidee

Bearbeiten

Im Rahmen der Lehrveranstaltung „Open Government und Open Data“ konnte ich über das Semester das „Wikiversum“ mit seinen unterschiedlichen Tools und Plattformen kennenlernen. Bei der Ideenfindung eines geeigneten Projektes war es mir daher folgende Aspekte besonders wichtig:

  • Erschließen neuer Inhalte: Im Wikiversum gibt es bereits unfassbar große Mengen an Daten und Informationen. Für mein Projekt ist es mir dabei wichtig gewesen, noch fehlende Inhalte zu recherchieren, zu erschließen und in geeigneter Form mit dem Wikiversum zu teilen. Dabei möchte ich auch meine persönlichen Interessen abdecken und ein Projekt finden, das ich über diese Lehrveranstaltung hinaus auch noch weiterführen kann.
  • Verschiedene Tools und Dienste: Neben Wikipedia gibt es viele weitere Tools und Dienste im Wikiversum. Hier möchte ich mein in der Lehrveranstaltung gesammeltes Wissen in die Praxis umsetzen und mehrere Tools und Dienste rund ums Wikiversum ausprobieren und anwenden. Besonders spannend finde ich automatisierte Abläufe, sodass etwa mehrere Bilder in Commons nicht manuell hochgeladen werden müssen, sondern automatisiert als Stapel verarbeitet werden können.
  • Einen Mehrwert erzeugen: Das Erschließen neuer Inhalte ist eine Sache, dass diese Daten aber dann tatsächlich auch nutzbar werden, eine andere. Daher soll das Projekt auch einen Mehrwert für das Wikiversum und all seine Besucher haben. Zum Beispiel auch dadurch, dass die Daten der einzelnen Dienste miteinander harmonieren und sinnvolle Verknüpfungen hergestellt werden (z.B. Zusammenspiel aus WikiData-Item und Wikipedia Commons-Inhalt und Wikipedia-Artikel).

Unter diesen drei Voraussetzungen habe ich schnell für mich entschieden, dass ein Bezug zu meiner Heimatstadt Stuttgart vorhanden sein soll.

Kultureinrichtungen und Parks gibt es viele in Stuttgart (wie hoffentlich in jeder anderen Großstadt). Was aber wirklich heraussticht und einzigartig ist, sind die schätzungsweise 600 „Stäffele“ in Stuttgart. Stäffele werden dabei Treppenanlagen bezeichnet, die sich über ganz Stuttgart verteilen. Aufgrund der „Kessellage“ - also dass Stuttgart ringsum mit (Wein-)Bergen umgeben ist, sind über die letzten Jahrhunderte viele Stäffele entstanden, die die Wohngebiete dadurch leichter begehbar machten.

Auf Wikipedia gibt es bereits einen Artikel hierzu mit einer Auswahl an Stuttgarter Stäffele, in den Commons gab es jedoch nur vereinzelt Bilder und weitere Informationen zu einzelnen Stäffele. Auf WikiData wurde noch gar kein Datenobjekt zu einer Treppenanlage in Stuttgart erstellt.

Daher habe ich mich dazu entschlossen, das Wikiversum um eine von mir durchgeführten Auswahl an Stäffele zu erweitern. Eine Auswahl deshalb, da sich die 600 Stäffele in ganz Stuttgart verteilen und ich zeitbedingt nur eine Auswahl für das Projekt treffen kann. Nach dem Projekt möchte ich nach und nach weitere Stäffele erweitern und ggf. auch als Projekt in der Community ausrufen, damit weitere Stäffele ergänzt werden können.

Projektplanung

Bearbeiten
 

Vor der eigentlichen Durchführung des Projekts wurde ein grober Plan erstellt.

Demnach besteht das Projekt aus drei Phasen. Zuerst soll der aktuell vorhandene Bestand analysiert werden. Ausgehend davon sollen einige der Stuttgarter Stäffele besucht und fotografiert werden. In der letzten Phase sollen die fotografierten Stäffele ins Wikiversum „übertragen“ werden.

Der genaue Ablauf der Phasen ist der Durchführung zu entnehmen.

Projektdurchführung

Bearbeiten

Phase 1: Bestand analysieren

Bearbeiten

Zunächst ging es darum, was bisher über die Stuttgarter Stäffele im Wikiversum existiert.

So liefert der Wikipedia-Artikel Stuttgarter Stäffele bereits eine gute Anlaufstelle, indem er allgemeine Informationen über die Stäffele liefert, zusätzlich jedoch auch eine Liste einiger Stäffele aufweist, samt Adresse bzw. umliegender Straßen. Teilweise waren hierzu bereits Bilder hinterlegt, einiges hat jedoch noch gefehlt.

In den Commons wurde bereits eine Kategorie für die Stuttgarter Stäffele angelegt. Hier sind bisher vor allem die Bilder vorhanden gewesen, die auch im Wikipedia-Artikel in der Liste vorkamen. Auch hier war die Auswahl jedoch sehr überschaubar.

Anders als in Wikipedia und Commons wurden in WikiData bisher nahezu kein Stäffele angelegt. Lediglich „Stuttgarter Stäffele“ war als Datenobjekt vorhanden, jedoch keine einzelnen Stäffele.

Da die Liste der Stäffele im Wikipedia-Artikel unvollständig war und ich im Rahmen des Projektes auch das Ziel hatte, das Wikiversum um neue Inhalte zu erweitern, habe ich über Google die Seite „Stufe um Stufe“ aufgefunden.

Im Rahmen einer Diplomarbeit zum Thema „Stuttgarter Stäffele“ hat Antonio Landsberger hier eine Liste vieler Stäffele veröffentlicht, mit genauen Angaben zum Stadtteil, Ort, Anzahl der Treppenstufen und vielem mehr.

Über eine in Google Maps geteilte Liste habe ich eine gute Übersicht über die Stäffele erhalten können.

Ausgehend von dieser Liste habe ich die Stäffele in die 5 Stadtteile (Mitte, Nord, Ost, Süd, West) aufgeteilt und mir zu jedem Stadtteil vier bis sechs Staffeln ausgesucht, die ich in den weiteren Phasen besuchen und übertragen möchte.

Diese Staffeln habe ich mir anschließend in eine eigene Google Maps Liste hinzugefügt, um das spätere Auffinden zu erleichtern.

Phase 2: Stäffele besuchen und dokumentieren

Bearbeiten

Bevor ich die in Phase 1 recherchierten Stäffele besucht habe, habe ich zunächst überlegt, welche Informationen der Stäffele ich beim Übertragen später benötige.

Ziel war, von den Stäffele jeweils ein Bild vom Anfang und vom Ende der Staffel zu machen. Zudem sollte die genauen GPS-Koordinaten in den Bildern gespeichert werden, damit das Übertragen später erleichtert wird und ich jede Staffel wiederfinden und zuordnen kann.

Daher habe ich mich auch für das Verwenden eines Smartphones für die Bilder entschieden. Damit steht ein Gerät für alle benötigten Informationen bereit. Aufgrund der Höhenlage der Staffeln ist leichtes Gepäck zudem ebenfalls von Vorteil.

Über mehrere Tage verteilt wurden anschließend die Stäffele von mir besucht. Stets zur Mittagszeit und bei sonnigem Wetter, damit alle Stäffele gut abgelichtet werden konnten und die Sonne von oben herab scheint (und Gegenlicht vermieden wird). Bis zur Ausformulierung dieser Projektdokumentation habe ich dabei alle Stadtteile (Mitte, Nord, Ost, Süd) besuchen können, Stuttgart-West fehlt noch und wird erst in den kommenden Tagen nachgeholt.

Über eine SPARQL-Abfrage ist nachfolgend visualisiert, welche Stäffele besucht und übertragen wurden:

 

Damit sind knapp 200 Bilder zustande gekommen. Manche (besonders lange) Stäffele wurden von mehreren Positionen (oben, unten, Mitte) abgelichtet. Manche jedoch auch nur von oben oder unten, da die Stäffele teilweise sehr gut besucht sind und sonst fremde Personen auf den Bildern vorhanden gewesen wären. Zudem wurde vieles sowohl im Hoch- als auch im Querformat aufgenommen, damit später das besser geeignete Bild ausgewählt werden kann.

Phase 3: Inhalte ins Wikiversum übertragen

Bearbeiten

In dieser Phase sollten die fotografierten Stäffele ins Wikiversum überführt werden. Wie bereits in der Projektidee erwähnt, lag der Fokus darauf, möglichst viel automatisiert in die Wikimedia Dienste zu übertragen. Also vom Bild-Upload über die Kategorie-Erstellung in Commons bis hin zum Erstellen und Verknüpfen der Datenobjekte mit den Bildern. Hierzu habe ich verschiedene Tools und Methoden getestet, die ich im Rahmen dieser Phase auch ausführlicher vorstellen werde.

Die richtige Reihenfolge

Bearbeiten

Bei der Umsetzung der dritten Phase erschien es mir besonders wichtig, genau zu überlegen, in welcher Reihenfolge welcher Teilschritt durchgeführt wird und wie sich dies auf die anderen Schritte auswirkt. Folgende Reihenfolge habe ich mir hierbei überlegt und umgesetzt:

  1. Bilder Upload + Kategorisierung
  2. Datenobjekt Erstellung und Verknüpfung mit Bild und Kategorie
  3. Ergänzung des Wikipedia-Artikels

Da sowohl 2 und 3 auf ein Bild der Staffel angewiesen sind, erschien der Bilder Upload als der erste sinnvolle Schritt.

Bilder-Upload

Bearbeiten

Zuvor wurde von mir bereits der Commons Hochlade-Assistent verwendet, der ein guter Schritt-für-Schritt Assistent für den Bild-Upload bietet. Da ich jedoch mehrere Bilder hochladen möchte, die grundsätzlich ähnlich aufgebaut sind, erschien mir ein automatisierter Batch-Upload deutlich spannender. Insbesondere, da ich diesen zuvor noch nicht verwendet habe.

Für den Bilder-Upload habe ich Pattypan verwendet – ein Programm zum gleichzeitigen Hochladen mehrerer Dateien.

Meine genaue Vorgehensweise habe ich in dieser Unterseite dokumentiert.

Erstellen der Datenobjekte

Bearbeiten

Nachdem die Bilder der Stäffele nun in Wikimedia Commons vorhanden sind, können nun die Datenobjekte in WikiData erstellt werden.

Hierbei habe ich mich an der Dobelstaffel als Vorlage orientiert, die ich bereits zuvor einzeln in WikiData angelegt hatte.

Auch hier bestand das Ziel darin, möglichst viel automatisiert zu erstellen, weshalb ich mich für eine Kombination von OpenRefine mit QuickStatements entschieden habe. OpenRefine diente dazu, die im Bilder-Upload erstellte Excel-Datei zu erweitern und die Werte über das Reconciling mit bereits vorhandenen Objekten und der Bilder in Commons abzugleichen. Das in OpenRefine erstellte Schema wurde dann zu Quick Statements exportiert und dort schließlich erstellt.

Meine genaue Vorgehensweise habe auch hier wieder auf einer Unterseite dokumentiert.

Ergänzungen des Wikipedia-Artikels

Bearbeiten

Der Wikipedia-Artikel der Stuttgarter Stäffele hat bereits sehr viele Stäffele aufgelistet, die Liste ist jedoch nicht vollständig und oftmals fehlen Bilder der Staffeln. In diesem Schritt wurden daher die in den vorherigen Schritten besuchten und in Commons und WikiData übertragenen Staffeln in den Wikipedia Artikel eingearbeitet. Dabei wurden sowohl noch nicht in der Liste vorhandene Staffeln, als auch Bilder und Straßen ergänzt. Die Änderungen sind zum Zeitpunkt der Veröffentlichung dieser Dokumentation noch ungesichtet.

Bearbeiten

Nachfolgend sind noch einige relevante Links zu den WikiData-Items, Categories und Bildern:

Ausblick

Bearbeiten

Ich konnte bereits einige Stäffele besuchen und abfotografieren, jedoch fehlen mir noch Stäffele aus Stuttgart-West. Daher werde ich in den nächsten Tagen und Wochen auch noch weiterhin an diesem Projekt arbeiten und weitere Stäffele ergänzen.

Zudem sind im Wikipedia Artikel auch Stäffele aufgelistet, die mir zuvor unbekannt waren und ich daher weder besucht noch ein Datenobjekt dazu erstellt habe. Insbesondere, da viele Stäffele sehr alt sind, existiert oft kein eindeutiger, offizieller Name. Dies erschwert den Abgleich von bereits vorhandenen Inhalten.

Daher wäre mein nächster Schritt, die gesamte Liste zunächst einmal auf Duplikate abzugleichen und anschließend über OpenRefine automatisiert Datenobjekte zu allen noch nicht in WikiData vorhandenen Stäffele zu erstellen. Regierungsbezirk, Name und ggf. Bild sind schließlich bereits in der Liste vorhanden. Update: Die noch nicht in WikiData vorhandenen Stäffele aus dem Wikipedia-Artikel wurden nun ebenfalls von mir via OpenRefine erstellt (Beispiel-Objekt: Q113517449). Die Koordinaten müssen hierbei jedoch manuell recherchiert und nachgearbeitet werden, wobei dies über eine Liste, die dann in OpenRefine importiert wird, dennoch Aufwand spart. Dies wäre damit der nächste logische Schritt, da anliegende Straßen der Stäffele im Wikipedia-Artikel großteils dokumentiert sind. Danach können dann nach und nach Bilder der Stäffele ergänzt werden.

Insbesondere über die Geschichte vieler Stäffele ist wenig bekannt. Ein Besuch im Stadtarchiv könnte hierbei möglicherweise weitere nützliche Informationen bieten, wodurch auch WikiSource verwendet werden kann, was bisher im Projekt keinerlei Anwendung fand. Dies wäre jedoch vermutlich auch als eigenständiges Projekt geeignet und allgemein auf die Stadtgeschichte ausweitbar. Das neu erlangte Wissen kann dann auch in WikiData hinterlegt werden (z.B. Baujahr, Namensgeber, etc. als Statements).

Im Rahmen dieses Kurses hatte ich erste tiefgreifende Kontakte mit dem Wikiversum. Auch wenn ich seit Jahren regelmäßig auf Wikipedia unterwegs bin und (ohne Account) auch schon den ein oder anderen Artikel bearbeitet habe, war ich mir davor gar nicht bewusst, wie vielseitig das Wikiversum und seine Community ist. Über Wikisource als Sammlung von Texten, über Wikimedia Commons für Medien, bis hin zu WikiData als Wissensdatenbank werden von Wikimedia ein breites Spektrum an Diensten bereitgestellt, die aktiv zur offenen, kostenlosen Weiterbildung beitragen.

Durch den Kurs und die wöchentlichen Treffen habe ich dabei einen sehr guten Überblick erhalten und konnte mich auch viel „ausprobieren“. Gerade durch die offenen Diskussionen während der Treffen und der verschiedenen Projektideen wurde dadurch die Kreativität gefördert und wenn mich eine bestimmte Funktionalität oder Feature besonders interessiert hat, konnte es auch direkt ausprobiert werden.

Deshalb bin ich sehr froh, dass ihr diesen Kurs an der HdM anbietet und hoffe, dass dieser auch weiterhin so bestehen bleibt. Ich kann nun verstehen, weshalb sich die Community ehrenamtlich so für das Wikiversum begeistern kann!

Zu meinem Projekt sollte gesagt werden, dass mich Automatisierungen und das Verknüpfen verschiedener Daten schon immer begeistert haben, ich gerade in den Semesterferien aber auch Abwechslung brauche. Gerade deshalb habe ich mit meinem Projekt eine sehr gute Balance zwischen reiner „PC-Arbeit“ und dem Entdecken meiner Umgebung und Natur gefunden.

OpenRefine fand ich sehr spannend durch die vielen Möglichkeiten und dem sehr guten Zusammenspiel mit WikiData und Commons. Das kombiniert mit einem Thema, zu dem ich auch direkten Bezug habe, hat mir daher auch viel Spaß gemacht. Ich werde auf jeden Fall noch weiter an diesem Projekt arbeiten.