Handbuch Wikidata
Dieses Handbuch entstand während einer Lehrveranstaltung von Ina Blümel im Studiengang Informationsmanagement an der Hochschule Hannover, SoSe 2021. Autoren: Julia Solohub, Jule von Sass, Jeanice Noraman, Hassan Rizk, Karin Sidik, Deniz Göker, Ilknur Gencer, Elif Celik, Buket Bayram, Sofinias Terefework und kann laufend aktualisiert werden.
Einleitung Wikidata
Bearbeiten"Wikidata ist eine freie, gemeinsame, mehrsprachige und sekundäre Datenbank zur Sammlung strukturierter Daten zur Unterstützung von Wikipedia, Wikimedia Commons, der anderen Wikis der Wikimedia-Bewegung und jedem auf der Welt.“ (Wikidata 2020)
- Frei: Die Daten in Wikidata sind für die Öffentlichkeit frei zugänglich. Die Weiterverwendung von Daten ist für unterschiedlichste Vorhaben erlaubt, sprich das Kopieren, Modifikation, Verteilung und Auswertung der Daten ist gestattet.
- Gemeinsam: Das Erstellen, die Verknüpfung von Wikidata-Daten sowie die Regeln des Erstellens werden von den einzelnen Benutzern administriert. Jeder Benutzer kann auf jegliche Inhalte zugreifen und diese bearbeiten. Automatische Bots speisen Daten in der Datenbank ein und vervollständigen diese.
- Vielsprachig: Wikidata ist mehrsprachig, d.h. die Daten können in mehreren Sprachen erstellt, verwendet, durchsucht und wiederverwendet werden. Jegliche erstellten Daten sind sofort in allen anderen Sprachen zugänglich.
- Eine sekundäre Datenbank: Wikidata stellt durch Quellenangaben eine Verbindung zu weiteren Datenbanken her, welche die Diversität und Nachweisbarkeit von abrufbaren Daten widerspiegelt.
- Sammlung strukturierter Daten: Durch die einfache Struktur von Wikidata ist die Verwendung von den bereits vorhandenen Inhalten leicht nachvollziehbar. Des Weiteren können Computer aufgrund dieser Struktur die Daten lesen und verarbeiten.
- Unterstützung der Wikimedia-Wikis: Durch leicht zu pflegende Infoboxen und Sprachlinks unterstützt Wikidata Wikipedia und verringert den Arbeitsaufwand. Dadurch wird die Qualität der Inhalte Wikipedias verbessert.
- Jeder auf der Welt: Jeder Benutzer aus aller Welt kann auf die Inhalte zugreifen und diese verwenden (vgl. Wikidata 2020).
Wikidatas Ziel ist eine Datenbank zu schaffen, welche strukturiert und zentralisiert aufgebaut ist, um Daten und Fakten der realen Welt zu beschreiben und abzubilden.
Autoren: Julia Solohub, Jule von Sass
Quelle: Wikidata (2020): Wikidata:Einführung. Online unter https://www.wikidata.org/wiki/Wikidata:Introduction/de [Abruf 09.03.2021]
Suche nach Objekten
BearbeitenUm nach einem Objekt zu suchen wird der Suchbegriff in die Suchleiste (1) eingegeben. Bei der Eingabe werden bereits in der Vorschau der Suchergebnisliste übereinstimmende Ergebnisse angezeigt und können direkt ausgewählt werden. Durch Enter oder Klick auf die Lupe wird die Suche durchgeführt und man gelangt zur Suchergebnisseite.
Abbildung 1: Suche auf der Startseite
Falls es das gesuchte Objekt nicht gibt, kann es über den Text in den Ergebnissen (2) oder links in der Navigationsleiste über „Ein neues Datenobjekt erstellen“ erstellt werden.
Abbildung 2: Suchergebnisse
Neues Objekt Erstellen
BearbeitenEs wird eine neue Seite geladen, über die man die Bezeichnung, Beschreibung und ggf. Aliasse eintragen kann (3). Mit Klick auf „Erstellen“ (4) wird das Objekt erstellt.
Abbildung 3: Neues Datenobjekt erstellen
Zur Bearbeitung des Objekts, beispielsweise um weitere Sprachen hinzuzufügen, klickt man auf „bearbeiten“ und gelangt so zur Konfiguration in weiteren Sprachen. Dort können zusätzliche Bezeichnungen etc. eingegeben werden (5) und durch Klick auf „Veröffentlichen“ oben rechts gespeichert werden.
Abbildung 4: Objekt bearbeiten
Autor: Jeanice Noraman
Funktionen
BearbeitenItems
BearbeitenEin Item (deutsch: Datenobjekt) stellt in Wikidata eine zentrale Einheit dar und besteht immer aus einer Datensatz-ID, die sich aus dem Buchstaben Q und einer Nummer zusammensetzt
- Beispielweise steht (Q105943528) für Gefallenendenkmal Lohnde
- Um vorhandene Items zu finden, gibt es 2 Herangehensweisen
- Einerseits die Eingabe eines Suchbegriffes in das Suchfeld (wie in Kapitel Suche nach Objekten beschrieben). Hierbei können unterschiedliche Ergebnisse angezeigt werden
- Andererseits kann nach der Eingabe eines Suchbegriffes über die Vorschau eine manuelle Auswahl zum konkreten Item führen
- Jedes Item kann pro Sprache einen Namen, eine Kurzbeschreibung sowie mehrere Alternativnamen (Synonyme) haben.
- weitere Bestandteile von Items sind Links zu Seiten in Wikimedia-Projekten (Wikipedia, Wikivoyage, Wikimedia Commons)
Items anlegen
Bearbeiten- Bevor ein neues Item erstellt wird, sollte geprüft werden, ob bereits so ein Item existiert
- Wenn ein Item noch nicht vorhanden ist, so hat man die Möglichkeit ein neues Item zu erstellen. Über diesen Link gelangt man zur Erstellungsseite. Dort wird der Name und die Beschreibung des zu erstellenden Items eingegeben.
- Items bestehen in der Regel aus einer Vielzahl von Aussagen. Diese enthalten Informationen über die reale Welt und sind der Kernteil jedes Items
- Sie gliedern sich in Eigenschaften (property) mit vorgegebenem Vokabular und ihnen zugewiesenen Werten beziehungsweise Inhalten.
- Aussagen in Wikidata können mit einem anderen Wikidata-Item oder mit einem externen Link verlinkt oder durch eine Eigenschaft inhaltlich oder objektiv beschrieben werden.
- Eine Übersicht über aller Eigenschaften von Wikidata kann in einer Liste eingesehen werden, wo ebenfalls überprüft werden kann, welche Werte dort eingetragen werden können.
Autor: Mehreme Madjuni
Statements/Aussagen
BearbeitenIn Wikidata ist ein Konzept, Thema oder Gegenstand als Objekt dargestellt. Jedes Objekt hat seine eigene Seite. Eine Aussage ist die Art und Weise, wie die Information oder Daten, die wir über ein Objekt haben, in Wikidata gespeichert werden. Dies geschieht, indem eine Eigenschaft mit mindestens einem Wert verbunden wird. Das ist die Grundlage einer Aussage. Aussagen können weiter ausgebaut, mit Anmerkungen versehen oder sie können in einen bestimmten Zusammenhang gebracht werden durch zusätzliche Werte, optionale Qualifikatoren, Bezüge und Rangfolgen. Aussagen dienen auch dazu, Objekte miteinander zu verbinden und führen zu einer vernetzten Datenstruktur.
Jedes Wikidata-Item kann mit Aussagen (statements) beschrieben werden:
Im Wesentlichen besteht eine Aussage aus einer Eigenschaft und einem Wert. Beispielsweise enthält das Item für die Stadt Hannover (Q1715) eine Aussage, die angibt, dass sich Hannover in Deutschland befindet. Die entsprechende Eigenschaft dafür hat die Bezeichnung “Staat” (P17). Aussagen in Wikidata können mit einem anderen Wikidata-Item oder mit einem externen Link verlinkt oder durch eine Eigenschaft inhaltlich oder objektiv beschrieben werden. Der aufgerufene Datensatz im Screenshot ist Hannover (Abb. 3). Die Eigenschaft Staat beschreibt das interne Wikidata-Item Deutschland. Die Eigenschaft LCNAF (Library of Congress Name Authoryity File) gibt einen externen Link wieder. Die KFZ- Kennzeichnung ist ein Beispiel für eine einfache Wertbeschreibung.
Qualifikatoren (qualifiers) werden in Wikidata benutzt, um eine Aussage näher zu beschreiben. Viele Aussagen benötigen weitere Qualifikatoren, um richtig interpretiert werden zu können. Sie liefern also zusätzliche Informationen und bestehen genau wie Aussagen aus einer Eigenschaft und einem Wert.
Ränge (hierarchies) sind Qualitätsfaktoren, die helfen, die Qualität einer Aussage einzustufen. Das Ranking wird nur angewandt, wenn es zu einem Item mehrere Aussagen mit der gleichen Eigenschaft gibt. Es gibt drei mögliche Rangstufen:
1. Herabgestufter oder zweifelhafter Rang für Aussagen, die nicht als zuverlässig betrachtet werden können oder von denen man weiß, dass sie Fehler enthalten.
2. Der Normale Rang ist für Aussagen, die relevante Informationen enthalten. Diese Informationen gelten allgemein als korrekt.
3. Vorrangig ist ein Rang bei Aussagen mit den wichtigsten und aktuellsten Informationen.
Abgesehen von einige Ausnahmen sollten möglichst alle Aussagen in Wikidata mit zusätzlichen Belegen (sources) versehen werden.In folgenden Fällen kann bei Aussagen auf Belege verzichtet werden:
- Wenn die Aussage allgemein bekannt und unumstritten ist.
- Wenn das Item, über das Aussagen gemacht werden, selbst als Beleg für diese Aussagen dienen kann – beispielsweise sind die Autoren und Autorinnen eines Buches in der Regel dem Buch selbst zu entnehmen.
- Wenn die Aussage sich auf eine externe Quelle bezieht, die selbst als Beleg dienen kann. Diese Ausnahme trifft auf die meisten Aussagen mit Normdaten-Eigenschaften in Wikidata zu.
Autoren: Hassan Rizk, Karin Sidik
Abgeleitete Aussagen
BearbeitenWikidata lässt nur in den seltensten Fällen inversive Properties zu. Um dieses Problem zu lösen und sie anzeigen zu lassen müssen folgende Schritte befolgt werden:
1. Ein Objekt mit der inversiven Bezeichnung der Property finden/erstellen.
- Es sollte ein "Objekt für inverse Bezeichner von Eigenschaften"(Q65932995) sein
2. Property die inversiv sein soll, muss eine Aussage mit der Eigenschaft "inversive Bezeichnung" (P7087) haben. Diese sollte als Item das im ersten Schritt erwähnte Objekt haben. 3. Zu den Einstellungen -> Helferlein und unter "Wikidata" den Haken bei "relateditems" setzen.
4. Im Objekt, in dem die inversive Property eines anderen Objekts nach unten scrollen und die Box "zeige abgeleitete Aussagen" anklicken.
- Dort werden alle Aussagen angezeigt, die sich aus anderen Objekten ableiten lassen.
Autor: Jeanice Noraman
References
BearbeitenEs ist wichtig, dass andere den Inhalt überprüfen können, um sicherzustellen, ob er korrekt ist und aus einer zuverlässigen Quelle stammt. Die Referenz/Quelle wird verwendet, um auf eine bestimmte Quelle zu verweisen, damit die Sicherheit der Ansprüche in Wikidata gewährleistet werden kann. Eine Referenz kann ein Link zu einer URL oder zu einem Objekt sein. Zum Beispiel ein Buch. Wikidata zielt nicht darauf ab, die Frage zu beantworten, ob eine Aussage korrekt ist, sondern nur, ob die Aussage in einer Referenz erscheint.
Schritt 1: Datenobjekt / Item
Das gewünschte Datenobjekt / Item auswählen
In diesem Beispiel: Elisabethkirche von 1867 in Langenhagen (Q105825900)
Schritt 2: Aussagen/Statement Die gewünschte Aussage/Statement auswählen
Schritt 3: References/Quelle/Fundstellen
Rechts Fundstelle hinzufügen anklicken
Im Feld Eigenschaft die Quelle eingeben
Im zweiten Feld hat man die Möglichkeit einen Wert einzufügen, das Feld kann aber auch freigelassen werden.
Anschließend oben rechts "Veröffentlichen" anklicken
Autoren: Deniz Göker, Ilknur Gencer
Quickstatements in Wikidata
BearbeitenÜber Quickstatements (QS) lassen sich Einträge bzw. deren Aussagen, Bezeichnungen, Beschreibungen und Alternativbezeichnungen in Wikidata schnell über einfach Befehle erstellen oder ändern. Somit dient QS als ein Werkzeug. Über das Tool lassen sich die Quickstatements generieren. Dafür wird eine bestimmte Syntax verwendet, die auf der Hilfe zu den Quickstatements Seite näher beschrieben wird.
Beispiel Wir möchten den Eintrag Brücke über den Zweigkanal bearbeiten indem wir den Staat Niederlande hinzufügen wollen. Gehen wir das Schritt für Schritt durch:
1. Einloggen mit seinen Wikidata Daten in quickstatements.toolforge.org.
2. Auf "Neuer Stapel" klicken.
3. Den Befehl eingeben indem man zuerst das zu bearbeitende Item Q105747124 anspricht, dann die zu bearbeitende Property Staat (P17) und zum Schluss der Wert, der eingefügt werden soll. Hier ist es Niederlande (Q55). Alle Bausteine werden durch ein "|" getrennt. Ebenfalls sollte ein Name für den Stapel eingefügt werden, wie in dem Beispiel "Änderung Staat".
4. Änderung über Quickstatements starten, damit der Befehl ausgeführt wird.
5. Am Ende wird der Status des Befehls gezeigt. Hier ist die Änderung erfolgreich durchgeführt worden.
6. In dem bearbeiteten Eintrag schauen, ob die Änderungen übernommen worden sind.
Autor: Julia Solohub
Mögliche Probleme/Hinweise
Bearbeitena) Kennungen/Identfiers – Wie und wo erstellen?
Bearbeiten1. Als erstes auf „Anweisung hinzufügen“ klicken. Anschließen „Denkmalatlas Niedersachsen Objekt-ID“ eingeben.
Die aus dem Denkmalatlas erkundigte Objekt ID veröffentlichen.
2. Die Kategorie „Kennung/Identifiers“ ergibt sich aus dem Hinzufügen einer Anweisung mit der Verknüpfung des Denkmalatlas automatisch nach der Veröffentlichung.
b) "Hilfe"
BearbeitenAuf der Menüleiste von Wikidata befindet sich die Kategorie „Hilfe“. Hier werden Hinweise sowohl für Anfänger als auch für Fortgeschrittene Benutzer gegeben.
c) Welche Properties gibt es? / Welche Property kann man für den Wert nutzten? =
Bearbeiten--> Liste in Wikidata mit allen Properties anlegen.
d) Fehlerhafter Wert wird einer Property zugewiesen
BearbeitenAusrufezeichen, Blitz oder Flagge werden angezeigt.
Das angezeigte Symbol anklicken, um die mögliche Fehlerbehebung / den Hinweis zu sehen.
e) Die benötigte Property ist nicht vorhanden/ Property soll ein neues Datenobjekt mit einem Datentyp sein
BearbeitenDie benötigte Property in diesem Fall selbständig neu anlegen.
oder
Hilfe durch Anschauen von anderen ähnlichen Properties holen, indem das Erstellen der Property ersichtlich wird.
f) Welche Property passt am besten zu dem Wert?
BearbeitenNach ähnlichen Einträgen suchen und überprüfen, unter welcher Property der Wert eingefügt wurde.
g) Bereits vorhandener Eintrag
BearbeitenDen Eintrag als Dublette mergen. Hierfür P31+ Q17362920 + Qulifikator P642 und das duplizierte Objekt eintragen. Siehe auch https://www.wikidata.org/wiki/Help:Merge/de
h) Probleme mit inversen Properties
BearbeitenDein Eintrag dazu finden Sie hier.
Autoren: Elif Celik, Buket Bayram
WD-Query
BearbeitenUnter einer Query versteht man eine Abfrage mit der eine Suche nach und innerhalb Wikidata Objekten und den zugehörigen Daten möglich ist. Für die Abfrage wird die SPARQL-Query-Sprache verwendet. Um diese zu erstellen, kann man den Wikidata Query Service benutzen. Ein weiteres hilfreiches Tool ist der Wikidata Query Builder. Der Wikidata Query Builder bietet eine visuelle Schnittstelle zum Erstellen einer einfachen Wikidata-Abfrage. Mit Hilfe der Abfragehelfer wird es jedem ermöglicht eine Abfrage zu erstellen, auch wenn man die SPARQL-Query-Sprache nicht beherrscht. Der Query Builder bietet nicht die volle Funktionalität von SPARQL, jedoch kann die Abfrage im Query Service geöffnet werden, wo sie weiter bearbeitet und erweitert werden kann. Weitere Informationen zu den Wikidata SPARQL-Query-Abfragen sind hier zu finden.
Anleitung des Wikidata Query Service
Bearbeiten- Um den Abfragehelfer zu öffnen muss man auf das runde Symbol mit dem i klicken
- Es erscheinen die zwei Felder "Filter" und "Anzeigen" sowie die Begrenzungsoption
- Beim Filter wird die Eingrenzung eingegeben, sprich das, was angezeigt werden soll. Beim Tippen erscheinen Vorschläge, die man abhängig von der gewünschten Abfrage auswählen kann. Mehrere Filter sind durch das Klicken auf das Plus Zeichen möglich.
- Beim Anzeigen kann man ebenfalls eintragen, was man als Ergebnis erhalten möchte. Auch hierbei werden beim Tippen Vorschläge angezeigt. Mehrere Anzeigemöglichkeiten sind ebenfalls möglich.
- Die Begrenzung ist dazu da die Anzahl der Ergebnisse einzugrenzen.
Anbei ein Erklärungsvideo, das eine SPARQL-Abfrage zeigt, wo alle Zoo-Instanzen, in denen Löwen und Eisbären vorkommen, abgefragt werden.
Diese Datei ist lizenziert unter der Creative-Commons-Lizenz „Namensnennung – Weitergabe unter gleichen Bedingungen 4.0 international“. Der Urheber dieses Werkes ist Jonas Kress. Es wurden keine Änderungen vorgenommen.
Nähere Informationen sind auf Wikidata SPARQL Query Service zu finden.
Anleitung des Wikidata Query Builder
Bearbeiten- Pro Bedingung gibt es ein Feld
- Über die Buttons "With" und "Without"(1) wird ausgewählt, ob die entsprechende Bedingung in die Abfrage eingebunden oder von der Abfrage ausgeschlossen werden soll
- Das Eigenschaftsfeld ("Property")(2) in einer Bedingung ist die Kategorie oder der Deskriptor für den Wert. Zum Beispiel wäre "Farbe" eine Eigenschaft, die für den Wert "blau" verwendet werden würde.
- Das Wertefeld ("Value") (3) enthält die konkreten Informationen, mit denen ein Element beschrieben wird. Zum Beispiel ist "blau" ein möglicher Wert für die Eigenschaft "Farbe".
- Außerdem wird ausgewählt, ob die Eigenschaft den Wert ein- oder ausschließen soll oder unabhängig vom Wert sein soll
- Die Ergebnisse können weiter eingeschränkt werden, indem ausgewählt wird, ob nur Aussagen mit oder ohne Referenzen angezeigt werden sollen (4)
- Über "Add condition" (5) kann eine weitere Bedingung hinzugefügt werden
- Bei mehreren Bedingungen wird durch "and" und "or" (6) ausgewählt, ob beide erfüllt sein müssen
- Bei den Einstellungen (7) kann die Anzahl der Ergebnisse auf eine bestimmte Zahl eingeschränkt werden. Außerdem können statt Labels auch nur IDs angezeigt werden.
- Über "Run query" (8) wird die Abfrage ausgeführt und das Ergebnis angezeigt
- Darüber hinaus ist es möglich einen Link für die Abfrage zu bekommen (9) oder sich die Abfrage im Query Service anzeigen zu lassen
Timeframe zum Projekt
BearbeitenLink zum Timeframe vom Projekt
Query zu Wikidata
Bearbeiten- Alle Denkmalatlas-Items in Wikidata: https://w.wiki/37oh
- Alle Denkmalatlas-Items, die Türme sind: https://w.wiki/37om
- Alle Denkmalatlas-Items, die Kirchen sind: https://w.wiki/37op
- Alle Denkmalatlas-Items in Hannover: https://w.wiki/37os
- Alle Denkmalatlas-Items mit Schutzkategorie "Baudenkmal": https://w.wiki/37ov
- Alle Denkmalatlas-Items, die Burgen sind: https://w.wiki/37ox
- Alle Denkmalatlas-Items, die Friedhöfe sind: https://w.wiki/37oz
- Alle Denkmalatlas-Items, bei denen Bilder hinterlegt sind: https://w.wiki/37o$
- Alle Denkmalatlas-Items, bei denen Koordinaten hinterlegt sind: https://w.wiki/38SY
Visualisierung auf einer Karte
Bearbeiten- Alle Denkmalatlas-Items mit Koordinaten (darstellbar als Karte): https://w.wiki/38TP
(Stand 26.03.2021)
- Alle Denkmalatlas-Items mit Koordinaten in einem 100km Radius von Hannover (darstellbar als Karte): https://w.wiki/38TT
(Stand 26.03.2021)
Autoren: Julia Solohub, Jeanice Noraman, Jule von Sass, Sofinias Terefework
Bearbeitung von Orte des Gestapoterrors in Niedersachsen
BearbeitenWikidata Query
BearbeitenDer nachfolgende Link zeigt die Query, für alle Wikidata Einträge zum Projekt "Orte des Gestapoterrors in Niedersachsen".
Des Weiteren werden die Orte des Gestapoterrors in Niedersachsen auf der Karte visualisiert.
Probleme und Lösungsvorschläge
BearbeitenBei der Erstellung der Items für die Orte des Gestapoterrors sind einige Probleme aufgetreten. Diese werden in der unten stehenden Tabelle samt möglichen Lösungen dargestellt.
Probleme | Lösungsvorschläge |
---|---|
Welche Properties gibt es? / Welche Property kann man für den Wert nutzten? | Eine Liste in Wikidata mit allen Properties anlegen. Es gibt bereits eine Liste, die einige Properties darstellt. Diese könnte man erweitern. |
Fehlerhaften Wert einer Property zugewiesen --> Blitz, Flagge oder Ausrufezeichen wird angezeigt | Auf das angezigte Symbol draufklicken und gucken, was man machen muss, um den Fehler zu beheben |
Benötigte Property gibt es nicht | Die benötigte Property neu anlegen. Zuerst aber auf Wikidata:Property proposal anfragen |
Der angelegte Eintrag ist bereits vorhanden | Den Eintrag als Dublette mergen. Dafür P31+ Q17362920 + Qualifikator P642 & Das duplizierte Objekt eintragen. Siehe Hilfe. Man kann aber auch den bereits vorhanden Eintrag bearbeiten. |
Welche Property passt am besten zu dem Wert? | Nach ähnlichen Einträgen suchen und gucken, unter welcher Property der Wert eingefügt wurde |
Neue Property anlegen
BearbeitenUm eine neue Property anlegen zu können, muss der Property Vorschlag erst einmal auf Wikidata:Property proposal diskutiert werden, bis dieser angenommen und in Wikidata aufgenommen wird. In das Feld "Eigenschaftsname" soll der Name der gewünschten Property eingetragen werden. Anschließend gelangt man auf ein Bearbeitungsfeld, wo man Daten eintragen muss, die bereits vorgegeben werden. Dahinter stehen nähere Beschreibungen, was dort eingetragen werden muss als Kommentare.
In diesem Beispiel sollte die Property "hat Gedenkort" für die Erstellung Items der Orte des Gestapoterrors. So sieht das Formular ausgefüllt aus:
Eigenschaftenersteller oder Administratoren sehen sich in nächster Zeit den Vorschlag an und beginnen eine Diskussion. Falls sie den Vorschlag für nachvollziehbar halten, können diese die Property anlegen.
Autor: Julia Solohub
OpenRefine
BearbeitenDefinition
BearbeitenOpenRefine ist eine Desktop Anwendung, die den Webbrowser als graphische Oberfläche nutzt. Mit OpenRefine kann man Daten aus einem Tabellenformat wie csv-Dateien oder tabulatorgetrennte Datein (tsv) angezeigt werden. Mit dieser Anwendung lassen sich Daten standardisieren und bereinigen. Folgende Vorteile lassen sich erschließen:
- Überblick über den Datensatz
- Standardisierung von Daten
- Aufteilung in detaillierte und übersichtliche Teile
- Vergleich von lokalen Daten mit anderen Datensätzen
- Erweiterung des Datensatzes mit weiteren Daten aus anderen Quellen
Nähere Erläuterung zu der Definition ist in librarycarpentry OpenRefine zu finden
Installation
BearbeitenFür die Installation von OpenRefine wird Java benötigt. Falls dies auf dem PC nicht vorhanden ist, muss das installiert werden. Danach muss man auf openrefine.org unter OpenRefine 3.4.1 das Windows Kit herunterladen. Die Datei openrefine-win-3.4.1 wird heruntergeladen, die dann entpackt werden muss. Anschließend auf openrefine.exe klicken, um OpenRefine zu starten. Ein separater Browser-Tab wird mit der Anwendung geöffnet.
Autor Julia Solohub
OpenRefine in Verbindung mit dem Denkmalatlas Niedersachsen
BearbeitenFür das Projekt sollen alle Datensätze, die noch nicht in Wikidata eingetragen sind, in OpenRefine importiert werden, um Denkmäler in Wikidata aufzustöbern, die noch nicht die Denkmalatlas-Property P:7900 haben. Zunächst müssen die Metadaten der Denkmäler vom Denkmalatlas heruntergeladen und importiert werden. Dazu muss man auf Coding Da Vinci auf den Link unten Metadaten und Metadateien klicken. Anschließend mit einem Rechtsklick auf den Ordner "Metadaten" klicken und diesen herunterladen.
Nachdem man die Metadaten heruntergeladen hat, muss man diese in OpenRefine importieren. Dafür klickt man "Datei hinzufügen" an und wählt die heruntergeladene Datei aus. Diese wird anschließend als ein XML-Baum angezeigt.
Probleme/Schwierigkeiten
Bearbeiten- Adressen in Wikidata können unterschiedlich angelegt werden
- Mehrere Objekte unter derselben Adresse
- Zu viele Datensätze
- -> Sehr lange Bearbeitungszeit
- -> Computer hatte bei der Verarbeitung starke Schwierigkeiten
- Leere Zeilen/Datensätze in der Tabelle, die wir entfernen mussten
- Unnötige oder doppelte Spalten, unklare Bedeutung der Spalten
- Probleme beim reconcilen
- -> Dauert durch die große Datenmenge sehr lange
- -> Mussten trotzdem manuell zu Wikidata-Items zugeordnet werden
- Daten ließen sich nicht in das Schema reinziehen
- Datenexport nicht möglich
Autor: Julia Solohub
Quellen
Bearbeiten...