Wikiversity:Fellow-Programm Freies Wissen/Einreichungen/Offene Standards zur Agentenbasierten Modellierung in der Biologie

Offene Standards zur Agentenbasierten Modellierung in der Biologie Bearbeiten

Projektbeschreibung Bearbeiten

Zur Zeit arbeite ich an der agentenbasierten Modellierung (ABM) der Angiogenese, also der Bildung neuer Blutgefäße aus bestehenden Blutgefäßen. Zur Koordination der Angiogenese ist die Interaktion verschiedener Signalkaskaden notwendig, insbesondere delta/notch, VEGF und BMP. Zu versuchen, der vielfältigen Interaktionen und Dynamiken dieser Signalwege und ihrer möglichen zusätzlichen Modulationen in einem einzigen allumfassenden Modell zu beschreiben, ist unmöglich. Vielmehr bietet es sich an, ausgehend von einem Grundgerüst essentieller Interaktionen, zusätzliche Signalwege modular hinzuzufügen, einzeln im Detail zu studieren und dann die Schlüsseleigenschaften vereinfacht in das Grundgerüst zu übernehmen oder iterativ auf ein umfassenderes Modell hinzuarbeiten.

Die agentenbasierte Modellierung bietet sich für eine solche Herangehensweise an, allerdings fehlt es derzeit an einem Standard, um Agenten unabhängig von der Simulationssoftware auszutauschen. Daher arbeite ich derzeit sowohl an einem Modell als auch an einer Simulations- und Modellanalyse Software.

Im Dezember 2017 plane ich, die erste Version der Software zu veröffentlichen. Die Hauptziele in der Entwicklung sind eine einfache Handhabbarkeit und verständliche sowie reproduzierbare Ein- und Ausgaben. Modelle werden in XML-Dateien spezifiziert, in denen die Parameterisierung von vorher im Programmcode implementierten Agenten und Variablen definiert wird. Simulationsergebnisse werden in kommaseparierten Textdateien abgespeichert. Um die Ausgabe reproduzierbarer zu machen ist geplant, diese auch in einem standardisierten Format zu ermöglichen (multicellDS[1]). Die Analysemethoden werden so entwickelt, dass die notwendigen Simulationsaufrufe frei konfigurierbar sind und Ergebnisse aus kommaseparierten Textdateien gelesen werden, die Analysewerkzeuge somit nahezu unabhängig von einer speziellen Software zur Simulation sind. Die Software wird unter Open Source Lizenz auf gitlab[2] veröffentlicht, so dass der Quellcode frei genutzt und weiterentwickelt werden kann.

In der zweiten Version soll die Software Modelle vollständig aus XML Dateien mit Hilfe von just-in-time Compilern generieren. Die Veröffentlichung der Software soll bis Juli 2018 erfolgen.

Ab Oktober 2017 werde ich verstärkt auf eine standardisierte Sprache zur Beschreibung agentenbasierter Modelle hinarbeiten, da in der ABM Community ein gravierender Mangel an reproduzierbar veröffentlichten Modellen besteht. Die offen veröffentlichten Modelle sind nahezu ausschließlich im Quellcode einer bestimmten Simulationssoftware geschrieben. Ein minimaler Konsens ist die Beschreibung von Modellen mit dem ODD Protocol[3]. Im Gegensatz dazu hat sich in der Modellierung von Reaktionsnetzwerken mit Differentialgleichungsmodellen ein XML-basierter Standard (SBML[4]) durchgesetzt, so dass mittlerweile Datenbanken mit kuratierten Modellen existieren[5]. Auf Grund der großen Nutzerbasis ist der Anreiz, auf SBML aufbauende, effiziente Software zu entwickeln entsprechend hoch. Ähnlich hoch ist im Gegenzug auch der Anreiz, das eigene Modell in SBML zu erstellen, da es ein reiches Angebot an Software für verschiedenste Aufgaben gibt. Um diesen offenen Standard hat sich also ein ganzes Ökosystem an Methoden und Inhalten gebildet. Die Arbeit an einer vergleichbaren Sprache für agentenbasierte Modelle ist aber weder möglich noch sinnvoll, ohne die Community von Anfang an zu involvieren. Daher muss die Arbeit von Anfang an öffentlich, also in Repositories, Wikis oder ähnlichen Foren stattfinden.

Damit dieses Unterfangen erfolgreich sein kann, müssen zunächst drei Ziele erreicht werden:

  1. Eine ansprechende, zu Diskussionen anregende Grundlage muss geschaffen werden,
  2. eine Plattform, auf der offen kommuniziert werden kann, muss vorbereitet werden und
  3. eine kritische Masse an Unterstützern oder zumindest Diskussionspartner muss gefunden und aktiviert werden.

Für alle drei Punkte kann auf existierende Strukturen zurückgegriffen werden, die zum Teil aus der ABM Community kommen (z.B. Foren), zum Teil aus angrenzenden Feldern (wie z.B. SBML). Nichtsdestotrotz ist vor allem der 3. Punkt kritisch und besitzt eine generelle Relevanz bezüglich ‚Open Science‘: Was nutzt es, alles offen zu publizieren, wenn es niemand liest? Wie kann man ein breites Publikum für die eigene Offenheit gewinnen?

Bis Juni 2018 plane ich, zusammen mit anderen die Zwischenergebnisse dieses Projektes in Form eines Artikels zu veröffentlichen. Darin sollen der aktuelle Status und das weitere Vorgehen zur Entwicklung dieses Standards dargelegt sowie ein erster technischer Entwurf in Form eines XML Schemas beschrieben werden. Zusätzlich ist es notwendig, Programme zur Übersetzung des Standards in den Quellcode etablierter Modellierungssoftware zu implementieren, um möglichst schnell eine praktische Relevanz zu etablieren.

Eine standardisierte Art und Weise, agentenbasierte Modelle zu beschreiben und auszutauschen wird dieser Methode einen immensen Schub geben. Ein solcher Standard ist nicht nur wünschenswert sondern sollte heutzutage, meiner Meinung nach, eine Selbstverständlichkeit sein.

Meine Erfahrungen möchte ich innerhalb des Instituts sowie innerhalb der Stadt weitergeben. Dazu plane ich, mich im Rahmen des Fellowships mit bereits existierenden Initiativen[6] zu vernetzen und eine Mozilla Study Group[7] aufzusetzen, um Open Science, vor allem in Bezug zu theoretischer Biologie und Systembiologie, aber auch experimenteller Biologie, zu diskutieren und umzusetzen. Eine Mozilla Study Group scheint mir hierfür geeignet, da sie dem Austausch einen strukturierten Rahmen gibt, auch um das erarbeitete Material frei verfügbar zu machen und sich mit anderen Gruppen überall auf der Welt auszutauschen. Die finanzielle Unterstützung möchte ich für die Organisation von Workshops nutzen, sowohl um den Austausch mit lokalen Kollegen zu fördern, als auch, um internationale Expertise und Impulse nach Berlin zu holen. Auch würde ich die finanziellen Möglichkeiten gerne nutzen, um mit dem Softwareprojekt neuartige Wege der Veröffentlichung zu testen, wie zum Beispiel peerJ[8] oder RIO[9].

  • Name: Clemens Kühn
  • Institution: Charite - Universitätsmedizin Berlin
  • Kontakt: clemens.kuehn@charite.de

Referenzen Bearbeiten

  1. http://multicellds.org/
  2. https://gitlab.com/
  3. Grimm, V. et al. The ODD protocol: A review and first update. Ecol. Modell. 221, 2760–2768 (2010).
  4. http://sbml.org/Main_Page
  5. http://www.ebi.ac.uk/biomodels-main/
  6. https://berlinbioinf.wordpress.com/
  7. https://science.mozilla.org/programs/studygroups
  8. https://peerj.com/
  9. https://riojournal.com/