OpenKnowledge2020/mhartkopf
Erkenntnisse beim Lesen der FAIR10
BearbeitenDieser Text gibt chronologisch die Gedanken beim Lesen von den FAIR10 wieder. Allgemein sind die Prinzipien gut und die Erläuterung der einzelnen Prinzipien verständlich und logisch nachvollziehbar. Der Gedanke hinter FAIR10 ermöglicht einen guten Austausch von Daten, welche vielleicht davor nicht ganz so gut abgedeckt wurden waren. Durch die FAIR10 ist dies nun einheitlich und strukturiert möglich. Es ist gut, eine oder mehrere übersichtliche Plattformen zu haben, auf der Daten hochgeladen werden können. So sind sie für alle Interessierten auf einen Blick sichtbar und auffindbar. Durch den Einsatz von Metadaten ist die Auffindbarkeit noch mehr gesichert, was sowohl für den Suchenden, wie auch für den Bereitstellenden positiv ist. Allerdings kann das umfangreiche Verfassen von Metadaten zeitintensiv sein, wodurch eine wie im Paper angesprochene Vorlage für die Metadaten hilfreich und zeiteffektiv sein kann. Eine Verpflichtung der Mindestangaben sichert zumindest eine gewisse Einheitlichkeit der Datensätze. PID helfen weiter bei der Vereinheitlichung von Datensätzen, Personen werden nicht mehr verwechselt, Datensätze immer der richtigen Person zugeordnet. Durch eine simple Identifikation werden viele mögliche Probleme ausgeschlossen. Bei den FAIR Prinzipien wird nicht außer Acht gelassen, dass Open Data nicht immer einfach zu ermöglichen ist, auch wenn es gewollt ist. Sich Möglichkeiten, insbesondere im wachsenden Softwarebereich zu überlegen ist wichtig. So kann ein größeres Feld an frei verfügbaren Daten gewährleistet werden, insbesondere für noch nicht partizipierende Organisationen. Eine einheitliche Erfassung von Anfang an erleichtert das Nutzen und auslesen für alle, auch die datenbereitstellende Person. Zu unterschätzen ist aber nicht, dass das Aufsetzen von einheitliche Spreadsheets zeitaufwendig sein kann, so muss der Nutzen durch ggf. Vorreiter deutlich zu erkennen sein. Ein einheitliches Vokabular zu verwenden lohnt sich insbesondere mit Hinblick auf die Maschinenlesbarkeit. Dies zu erfüllen sollte aber nicht zu einem erheblichen Mehraufwand werden, deswegen ist es gut, dass es bereits viele Möglichkeiten gibt, mit einheitlichem Vokabular zu arbeiten und frei auf dieses zuzugreifen. Eine einfache Methode, seine Daten in RDF umzuwandeln ist sehr wichtig, um den Arbeitsaufwand gering zu halten, allerdings sollten auch Dateiformate wie Excel simpel umwandelbar sein. Lizenzen und Zitation sind ein wichtiger Faktor und insbesondere die einfache Verlinkung durch PIDs ist die Zitation einfach und doch effektiv. Dass auch Policis beachtet wurden schließt das umfassende Bild des FAIR10 gut ab. So wurde hier an alle Aspekte gedacht, um die Daten in eine einheitliche Form zu bringen. Den Mehraufwand, der dahintersteckt, sollte man trotzdem nicht außer Acht lassen und deswegen sollten auch positive Ergebnisse und Erfahrungsberichte an die möglichen neuen Partizipierenden gebracht werden.
Aufgabenbearbeitung
BearbeitenAufgabe 1
Es gibt 8 verschiedene downloadbare Datensätze unter dem Reiter Data Files. In dem Unterordner archief sind drei Datensätze in dem offenen Format .txt verfügbar, unter dem Ordner codeboek sind die verbliebenden 5 Datensätze ebenfalls als .txt verfügbar. Gedownloadet können die Files erst werden, nachdem man sich auf der Website angemeldet hat. Dass das downloaden erst nach dem Anmelden auf der Website möglich ist, hat sicherlich Gründe, allerdings wäre eine Erläuterung dieser gut gewesen. Auch ein größerer Hinweis, dass ein Login nötig ist, wäre gut gewesen.
Aufgabe 8
Der erste Licence Picker ist meiner Meinung nach nicht wirklich hilfreich, es gibt zu wenig Auswahlmöglichkeiten, hinzukommt, dass die Website sehr unübersichtlich ist. Ich hätte vermutlich keine Lizenz gefunden, bzw. mich nicht auf das Ergebnis dieser Website verlassen. Der zweite Licence Picker ist deutlich umfangreicher und befasst sich mit der Softwareentwicklung. Allerdings ist auch bei diesem Picker die Möglichkeiten, wirklich durch „angeben“ was man benötigt keine deutliche Lizenz zu finden. Letztendlich ist die Seite nur eine gute Zusammenstellung der Lizenzen, hilfreich, aber kein Picker, sondern nur eine Hilfestellung. Den angegebenen Guide gibt es unter dem Link nicht mehr. Allgemein ist es möglich, mit Hilfe insbesondere des zweiten Links eine vernünftige Lizenz rauszusuchen, allerdings nur mit der auf der Website vorhanden Informationen, nicht durch eine Art „Picker“. Wenn ich beispielsweise mit einem Datensatz arbeite, bei dem nur eine Lizenz und Copyright Notiz benötigt wird, der ansonsten aber frei zum Bearbeiten und Verbreiten ist, würde ich anhand der Informationen die MIT Licence wählen.