Kurs:Partizipative Transkriptionsprojekte (DieDatenlaube)
Die Gartenlaube und die Datenlaube – Erschließung von Transkriptionen in Wikisource mit Wikidata
Ein praktischer Erfahrungsaustausch am Museum für Naturkunde, online 28. und 29. Oktober 2021
GLAM-Kolleg:innen in Museen, Archiven, Bibliotheken
Vortrag und Hands On Lab
Die Datenlaube: Jens Bemme (SLUB Dresden) und Matthias Erfurth (Stadtwiki Dresden)
Skript für Vortrag und Hands On-Workshop am 29. Oktober 2021, ab 13 Uhr
Projekt*e
BearbeitenDie Gartenlaube und Die Datenlaube – Erschließung von Transkriptionen in Wikisource mit Wikidata, Beitrag zum Tagungsband, DOI 10.5281/zenodo.7080199, Preprint
Die Gartenlaube
BearbeitenLangjähriges Großprojekt der deutschprachigen Wikisource-Community
Diese Daten (Scans, OCR, Texte, Bilder) sind Grundlage für Die Datenlaube:
- Wikisource: Die Gartenlaube, bisher Jahrgänge 1853-1899 in Wikisource (später mglw. weitere) – Quellen und Volltexte
- circa 20.000 Artikel, teils illustriert (Detailabbildungen und Doppelseiten), vgl. Projektstand
- OCR-Korrekturen: 4 bzw. 6-Augen-Prinzip in Wikisource, Artikel- bzw. Seitensstrukturierung
- Bilder freistellen in Wikimedia Commons (u.a. Croptool [1])
- Artikelseiten anlegen (Tutorial auf https://diedatenlaube.github.io)
Die Datenlaube
BearbeitenBinationales Citizen Science-Projekt für und mit offenen Kulturdaten der Gartenlaube
https://diedatenlaube.github.io/, Twitter: @DieDatenlaube, Wikiversität: DieDatenlaube (DatenlaubeJam meist am Dienstagmorgen)
- skriptbasierte Formalerschließung aus den Textdatenboxen der Wiksiource-Artikelseiten durch Stapelverarbeitung in Wikidata, inzwischen circa 1x wöchentlich aus allen neu angelegten Wikisource-Gartenlaubeartikeln
- inhaltliche Sacherschließung (main subject) der einzelnen Artikel-Items in Wikidata: Bilder, Bildunterschriften, Illustratoren, Zitationen, bibliografische Zusammenhänge (Serien-Items)
- Vorträge, Veröffentlichungen: Poster, Artikel, Blogposts
- Queries: Wikidata-Abfragen
- Wikisource: Wikidata#Abfragen für Die Gartenlaube – Quellen und Volltexte
- Structured Data On Commons: punktgenaue Metadaten für relative Bildpostionen von Bilddetails mit https://wd-image-positions.toolforge.org/
- So hängen unsere #transkription21-Gartenlaube-Infrastrukturen zusammen: Tweet, 27. Okt. 2021
- Beteiligte und Motivation
- Nebenaspekte
- F&E, eigene Forschungsfragen
- Wissenschaftskommunikation, Projektbibliografie in (Q61943025)
- Visualisierungen/ Mapping, auch für und mit 'Dritten': Sachsens arboreale Merkwürdigkeiten, oder: Wie man Geschichte(n) verwurzelt, Solvejg Nitzke, 2019: Wikidata-Query: Orte der Gartenlaube-Artikel in der Serie „Deutschlands merkwürdige Bäume“, https://w.wiki/4A3 (Christian Erlinger)
- Wikicite
- #TrickleDownDatenlaube: inhaltlicher Beifang bzw. beiläufige Metadaten- und Linkpflege in Wikidata, Wikipedia, Wikisource (zuweilen auch GND)
= Die Datenlaube i.w.S.
Allgemein: Wikisource+Wikidata
BearbeitenDieDatenlaube ist im Grunde ein beispielhaftes Pilotprojekt für alle Transkriptionen in Wikisource. ("Man müsste mal!")
Zum Beispiel derzeit laufend:
- Wikisource: Die Bereitung warmer und kalter Bowlen, 1885 (SLUB Dresden) – Quellen und Volltexte
- Sammelbandkorrektur in en:Wikisource: Wikipedia and Academic Libraries: A Global Project, 2021
Wikisource ist geeignet (mit Blick auf GLAM- und [Open] Citizen Science-Anliegen):
- für kleine Transkriptions- und solche Pilotprojekte für gemeinfreie Werke im Wikiversum
- um digitale Objekte und Bestände sichtbar und nutzbar zu machen
- für deren Vernetzung bzw. Erschließung im Wikiversum (Wikidata, Wikipedia, Wikiversity, ...)
- für Schulungsprojekte: Digital Humanities, Linked Open Data-Strategien/LOD-Denke, in house mit Mitarbeiter*innen z.B. im Zusammenhang mit 1lib1Ref (bzw. 1lib1nearby)-Aktionen
- vgl. Gavin Willshaw: WIKISOURCE AS A TOOL FOR OCR TRANSCRIPTION CORRECTION: THE NATIONAL LIBRARY OF SCOTLAND’S RESPONSE TO COVID-19, 2021
- fürs lokale wie auch fürs überregionale Community-Building
- für die offene Projektkommunikation i.V.m. illustrierten Metadaten-Vorschaubildern aus Wikidata-Items: open GLAM-Produktion von (bibliografischen) Social Media- & Wisskomm-Inhalten
Herausforderung: Schnittstellen zwischen Wikidata und Verbundkatalog (K10+). Wikisource-Volltexte werden bereits in der Sächsischen Bibliografie und im Katalog der SLUB ausgewiesen, vgl. Spezial-Tourenbuch für Radfahrer und Touristen durch die Sächsische Oberlausitz > SAXB.
Hands On
BearbeitenEin Arbeitsschwerpunkt für die Anlage separater Artikelseiten ist gerade noch (für uns) Jahrgang 1891. Dort kann korrigiert werden, andere Jahrgänge können auch bearbeitet werden.
- Wikisource: Wo eines Kaisersohnes Wiege stand und ein Kurhut vergessen ward – Quellen und Volltexte
- Wikisource: Welke Blätter – Quellen und Volltexte
- Wikisource: Zu J. G. Fischers fünfundsiebzigstem Geburtstag – Quellen und Volltexte
- Wikisource: Zum hundertjährigen Geburtstag des Komponisten der „Hugenotten“ – Quellen und Volltexte
- Wikisource: Die Poesie der Elektrotechnischen Ausstellung – Quellen und Volltexte
- Wikisource: Aus vormärzlicher Zeit – Quellen und Volltexte
- Wikisource: Das Jubiläum eines Adlerjägers – Quellen und Volltexte
- Wikisource: Für das Rothe Kreuz – Quellen und Volltexte
- Wikisource: Hebung gesunkener Schiffe – Quellen und Volltexte
- Wikisource: Zum Gedächtnis Mozarts – Quellen und Volltexte
Aufgaben
Bearbeiten- Kick auf [Seitenzahl] im jeweiligen Artikelfließtext führt zur Quellseite der Artikel-OCR, dort Textkorrektur (Formatierung und Sectionierung) sowie Statusänderung der OCR-Seite unkorrigiert (Rot) > korrigiert (gelb) > fertig (grün) am Texteditor unten & Speichern.
- Klick Bearbeiten einer Artikelseite offenbart die vorlagenbasierte Zusammensetzung der Artikelseiten aus den verschiedenen - ggf. sectionierten - OCR- und Bilderquellseiten. Die Metadaten der Textbox dienen uns für die Erschließung in Wikidata; Wikipedialink = erstes Schlagwort main subject; Sonstiges z.B. für Permalinks zu Digitalisaten im Artikel zitierter Literatur (ggf. #WikiCite, wenn zitierte Quelle mit spezifischem Item erschlossen wird).
Exkurs LOD-Interwikilinks (Stadtwiki Dresden)
BearbeitenDresden's Wintergarten
- Exzerpt im Stadtwiki Dresden
- (Q61572007) bei Wikidata
Beispiele für Gartenlauben-Abfragen
BearbeitenWerkzeug
Bearbeiten-
Wikisource-Broschüre, 2019
-
Wikidata-Broschüre, August 2019
-
Wikisource Infostand in der SLUB Dresden
-
Wikisource
-
Commons
-
Wikidata
-
WikiCite
-
Metadata roundtripping of GLAM data with Wikidata and Wikimedia Commons
Tagungsband
BearbeitenStört, D.; Schuster, F.; Hermannstädter, A. (2022). Partizipative Transkriptionsprojekte in Museen, Archiven und Bibliotheken. [Dataset]. Data Publisher: Museum für Naturkunde Berlin (MfN) - Leibniz Institute for Evolution and Biodiversity Science. https://doi.naturkundemuseum.berlin/data/10.7479/szm4-fs62
Bemme, Jens, Christian Erlinger und Matthias Erfurth: „Die Gartenlaube“ und „Die Datenlaube“ : Erschließung von Transkriptionen in Wikisource mit Wikidata, doi 10.5281/zenodo.7080199 Preprint