Wikiversity:Fellow-Programm Freies Wissen/Einreichungen/Open Interviews/Interviews/Thiemann
Nachhaltiges Forschungsdatenmanagement und Open Science an der Universität HamburgBearbeitenInterview von Andreas Möllenkamp mit Stefan ThiemannBearbeitenDas Interview wurde im Rahmen des Forschungsprojekts Open Interviews. Auf dem Weg zur Öffnung qualitativer Interviewforschung von Andreas Möllenkamp zwischen Januar und März 2019 per Email geführt. Das Projekt wurde durch das Fellow-Programm Freies Wissen vom Stifterverband für die Deutsche Wissenschaft, Wikimedia Deutschland und der VolkswagenStiftung gefördert. Dr. Stefan Thiemann (ST) ist Leiter des Zentrums für nachhaltiges Forschungsdatenmanagement und Open-Access-Beauftragter der Universität Hamburg. Andreas Möllenkamp (AM) ist Kultur-, Musik- und Medienwissenschaftler und lebt in Hamburg. AM: Herr Thiemann, Sie sind als Leiter des Zentrums für nachhaltiges Forschungsdatenmanagement an der Universität Hamburg nicht nur mit einer großen Vielfalt unterschiedlicher Forschungsdaten sowie Software- und IT-Systemen konfrontiert, sondern auch mit sehr unterschiedlichen Fachkulturen und ihren spezifischen Ansprüchen. Was raten Sie qualitativ forschenden Sozial- und Kulturwissenschaftler/innen, die ihre Interviews (in Form von Audio-, Video- sowie Transkriptdateien) langfristig archivieren und mit internationalen Kolleg/innen daran arbeiten wollen? ST: Zunächst einmal alle Vorschriften bzgl. Datenschutz einzuhalten (was meist geschieht). Oft darf man z.B. Audio/Video-Aufzeichnungen nicht einmal auf einem öffentlichen Server speichern. Auf die Praktikabilität der Lösung zu achten. D.h. die Ansprüche nicht in den Himmel zu schrauben, deshalb eine eigene Lösung aufbauen, die dann am Ende des Projektes abgeschaltet wird. Erster Schritt wäre deshalb zu schauen ob es eine zentrale Lösung (z.B. GESIS) gibt, die verlässlich ist, für diesen Datentyp gut geeignet und in der Community auch sonst benutzt wird. Gibt es eine solche Lösung nicht oder kommt die aus anderen Gründen nicht in Frage, dann ein Repositorium benutzen, welches eine verlässliche Speicherung, Zugriffsrechte und einen Nachweis mit einer DOI bietet. Wir bauen z.Z. an der UHH so etwas auf. Die Daten werden mit Metadaten nach DataCite-Standard beschrieben und werden langfristig verfügbar sein. Dabei handelt es sich aber dann eher um ein Archiv, d.h. es sollten unveränderliche Daten sein, wie es z.B. bei den Originalaufnahmen ja der Fall wäre. D.h. in der Regel wird man zweistufig vorgehen. Für die tägliche Arbeit hält man lokale Kopien, z.B. auf Projektlaufwerken. Archivierbare Daten werden entsprechend behandelt. Die Projektlaufwerke können dann am Ende ruhig gelöscht werden. Bzgl. Datenformaten sollten immer übliche Standardformate genutzt werden. Hat man z.B. aus einer Kamera ein Herstellerformat, dann sollte diese Datei gespeichert werden, zusätzlich aber auch eine Kopie in einem üblichen Format (z.B. mp3). Zusätzlich sollten immer die Rahmendaten, womit wurde die Aufnahme gemacht, wer hat sie gemacht, wo und wann, wozu gehört sie usw. in einer Readme-Datei mitgespeichert werden. Ansonsten hat man irgendwann keinerlei Bezüge mehr. Ein Problem bleibt leider zu oft, die Kooperation mit internationalen Wissenschaftlern. Google und Co. darf bei uns in der Regel nicht genutzt werden. Filmaufnahmen bei Dropbox gehen gar nicht. Andererseits sind dies aber genau die Tools, die in der Welt benutzt werden und zu denen alle Zugriff haben. Tools der Universitäten sind oft nur für Universitätsangehörige. Grundsätzlich wäre ich immer vorsichtig kritische Daten in Dropbox und Co. zu verteilen. Man verstößt damit direkt gegen den Datenschutz. Ob man z.B. ein Interview aus Hamburg einem Kollegen in Washington einfach so geben darf hängt von der Einverständniserklärung ab, die man sich eingeholt hat. Es gibt leider keine rechtliche Freiheit für die Wissenschaft, was solche Dinge angeht. Ich würde mir so etwas in der Einverständniserklärung zusichern lassen und die Daten dann über universitäre Austauschordner verteilen und mir zudem von den Kollegen ebenfalls zusichern lassen, dass diese Dinge entsprechend behandelt werden. AM: Die Ansprüche an den Datenschutz sind mit der europäischen Datenschutz-Grundverordnung umfangreicher geworden. Stellen Sie Forscher/innen entsprechende Einverständniserklärungen bzw. Qualitätssicherungs-Checklisten zur Verfügung, die Forschungsdaten veröffentlichen wollen? Wer kann und sollte diesen Aspekt der Prüfung von Forschungsdaten am besten übernehmen? ST: Solche Checklisten sind in Planung. Leider aber auch schwer in rechtssicherer Form zu erstellen. Aktuell sind wir in der Abstimmung eines Rechtskompendiums, welches im Rahmen von Hamburg Open Science erstellt wurde. Grundsätzlich sollten Fragen, die sich um den Datenschutz in Projekten mit personenbezogenen und besonders schützenswerten Daten immer mit dem zuständigen Datenschutzbeauftragten besprochen werden. AM: Sie vertreten eine differenzierte Betrachtung der Vor- und Nachteile bei der Frage, wie Forschungsdaten und Publikationen archiviert und veröffentlicht werden sollten. Was sind eigentlich die Nachteile von Open Science und Open Access, insbesondere für Forschende in den Geisteswissenschaften? ST: Bis auf wenige Ausnahmen wird Forschung in Deutschland aus Steuermitteln finanziert. Die Ausnahmen beziehen sich auf Forschung im Auftrag bzw. mit Mitteln der Industrie, in solchen Fällen müssen die Bedingungen auf Geheimhaltung akzeptiert werden. In allen anderen Fällen ist die Forderung nach einer Öffnung berechtigt. Open Access meint den für den Nutzenden (=Leser) kostenlosen Zugang zu wissenschaftlichen Ergebnissen wie Artikel, Bücher usw. Da sich praktisch alle wissenschaftlichen Publikationsformen (Zeitschriften, Bücher, Reihen) in der Hand von kommerziellen Verlagen befinden und es zudem eine zunehmende Konzentration auf wenige große Verlage in den letzten Jahren gegeben hat, sind die Preise z.B. für Zeitschriften enorm gestiegen. Selbst Bibliotheken in reichen Ländern können sich ein Vollprogramm nicht mehr leisten. In Entwicklungsländern ist dies praktisch überhaupt nicht möglich. Open Access soll hier gegensteuern. Nicht der Nutzende soll zahlen, der Produzent soll zahlen. Nun lässt sich so ein System nicht einfach umstellen. Noch haben wir eine Zwischenlösung und die Verlage lassen sich nun Open Access bezahlen und nehmen gleichzeitig noch Verkaufsgebühren. Forschende sind in der Zwickmühle, da sie für die Open Access Gebühren eigentlich keine Mittel haben. Die Gründung neuer Zeitschriften in Forscherhand ist möglich, hat aber viele Nachteile. Von diesen Problemen abgesehen hat Open Access keine Nachteile für Forschende. Studien zeigen, dass die Nutzung solcher Artikel und Bücher eher zunimmt. Open Science ist umfassender gemeint. Neben Open Access beinhaltet es auch Open Data und die Öffnung des Forschungsprozesses an sich, also z.B. öffentliche Veranstaltungen, Citizen Science und die Bereitstellung von Informationen über Forschung wie z.B. welche Forschende gibt es, welche Projekte, wo findet Forschung statt usw. Auch dies ist nicht mit Nachteilen (evtl. mit mehr Arbeit) verbunden, nimmt doch in der Regel das Interesse der Bevölkerung zu und die Verbreitung von Wissen kann kein Fehler bzw. Nachteil sein. Dies zeigen die erfolgreichen Veranstaltungen z.B. in Hamburg (Tage der offenen Tür, Nacht des Wissens, Wissen vom Fass usw.). Sicherlich gibt es durch Transparenz auch in Einzelfällen zunehmende Kritik. So kann z.B. in der Genforschung oder der Künstlichen Intelligenz mit Kritik gerechnet werden, wenn man offen über solche Projekte informiert. Dies mag man als Nachteil sehen, kann es aber auch als Herausforderung betrachten seine Arbeit verständlich zu machen und Ängste abzubauen oder auch aufzunehmen. Open Data ist sicherlich in einigen Bereichen ein Problem. Eine Verpflichtung dazu gibt es aber auch nicht. Es sollte nur sichergestellt sein, dass man die Daten auffinden und zuordnen kann. Forschungsdaten sind auch kein Eigentum der Forschenden, dies ist insb. in den Geisteswissenschaften eine weit verbreitete Meinung. Viele der oft genannten Gründe - da kann ja jemand schneller sein; warum soll jemand meine (!) Daten benutzen dürfen; meine Forschung muss man nicht nachvollziehen können - sind nur scheinbar zutreffend. Niemand verlangt, dass man Daten noch während der Forschungsarbeit publiziert. Zudem es sich in den Geisteswissenschaften oftmals nicht einmal um einmalige Daten handelt. Wer Goethe bearbeitet kann wohl kaum behaupten, dass diese Daten „seine“ sind. Dies könnte eher ein Physiker behaupten, der persönlich eine Messung gemacht hat und trotzdem wird dieser seine Daten eher offen anderen bereitstellen. In der Summe sehe ich also keine Nachteile, bzw. die wenigen Nachteile in Einzelfällen sollten nicht die gesamte Diskussion überschatten. AM: Argumente für Open Science haben Sie ja schon genannt. Welche anderen Maßnahmen zur Förderung von Open Science halten Sie für wünschenswert und sinnvoll und welche nicht (Berücksichtigung in Förderrichtlinien, Weiterbildungs- und Serviceangebote an den Hochschulen, Preise, Vorteile bei Berufungsverfahren/Stellenbesetzungen, Berücksichtigung von Mitteln und Zeit für den Mehraufwand etc.)? ST: Genau die von Ihnen genannten „Vorteile“ könnten es sein und werden ja zum Teil auch bereits angewandt, wie z.B. bei der Drittmittelförderung. Was natürlich nicht passieren darf, dass schlechte Open Access-Publikationen höher gewertet werden als gute non-Open Access-Publikationen. So etwas wäre dann quasi wie eine Quotenregelung, die in der Regel auch nur ein merkwürdiges Ergebnis liefert. Ein weiteres gutes Argument würde erst zutreffen, wenn alle Open wären, dass nämlich auch die Qualität steigen kann, dass auch andere Ideen bei gleichen Grunddaten zu neuen Erkenntnissen führen können usw. Dies würde aber auch erfordern, dass man gegenseitigen Respekt hat und nicht anderen einfach die Forschung klaut. In einigen Wissenschaften klappt so etwas sehr gut, z.B. im Bereich der Astronomie. AM: Es wird sowohl auf europäischer, nationaler und Länder-Ebene sowie durch Fachgesellschaften und einzelne Projekte an Forschungsdateninfrastrukturen gearbeitet. Für einzelne Forscher/innen ist es daher nicht einfach zu entscheiden, welche Forschungsdateninfrastruktur sie am besten nutzen sollten. Wie sollte die Entwicklung von Forschungsdateninfrastrukturen am besten organisiert bzw. koordiniert werden, um möglichst nutzerfreundlich und nachhaltig zu sein? Welches Maß an (De-)Zentralität und Wettbewerb halten Sie in diesem Feld für sinnvoll? Und wie findet man als Forscher/in die am besten geeignete Intrastruktur? ST: Gute Frage, auf die es keine gute Antwort gibt. Wie immer in der Welt, hat man nach Jahrzehnten der Vernachlässigung plötzlich auf allen Ebenen das Forschungsdatenproblem entdeckt. Und wie immer gibt es viele Lösungen und Beteiligte. Grundsätzlich ist schon mal der Ansatz es überhaupt zu machen der vernünftige Ansatz. Aus meiner Sicht sollte zunächst immer die lokale Struktur, also das Forschungsdatenmanagement an der eigenen Forschungseinrichtung die nächstliegende sein. Nur, wenn es zentrale, professionell betriebene und auf langfristigen Betrieb ausgerichtete Einrichtungen gibt, dann machen die Sinn. So etwas gibt es z.B. in der Astrophysik, in der Klimaforschung, in der Sozialforschung und einigen anderen Bereichen. Aber dort werden auch nicht alle Daten genommen, die Daten müssen bestimmte Bedingungen erfüllen. Deshalb ist es aus meiner Sicht auch wichtig, dass es lokale Datenarchive gibt, wo man den Rest unterbringen kann. Die Forschenden dürfen nicht mehr verlangen, dass es spezielle Metadaten für ihre Daten gibt, es geht um ein Archiv und keine hochspezialisierte Datenbank. Überhaupt ist der Vergleich mit realen Archiven sowohl in der Art des Umgangs, wie auch in der Organisation gut geeignet. Auch dort werden unterschiedlichste Materialien nach ähnlichen Kriterien gesammelt und es gibt von lokalen bis zu zentralen Archiven alle Ebenen und jede hat ihre Berechtigung. Wichtig ist bei allem nur die Vernetzung. Es muss also möglich sein Daten zu finden. AM: Herzlichen Dank.
Möllenkamp, Andreas & Thiemann, Stefan (2019): Nachhaltiges Forschungsdatenmanagement und Open Science an der Universität Hamburg. https://de.wikiversity.org/wiki/Wikiversity:Fellow-Programm_Freies_Wissen/Einreichungen/Open_Interviews/Interviews/Thiemann DOI: 10.5281/zenodo.2611153 |