Virusausbreitung/Modellierung/Gewöhnliche Differentialgleichung/Einführung/Beispiel
Wir versuchen, die Ausbreitung einer Virusinfektion wie bei den Wellen der Corona-Pandemie seit 2020 zu modellieren. Die Ausbreitung wird durch eine Funktion
beschrieben, wobei für die Zeit und für die Gesamtanzahl der bis zum Zeitpunkt Infizierten (einschließlich der Genesenen) angibt. Dies ist zunächst eine empirische Funktion, die man aus verschiedenen Gründen auch gar nicht genau kennt, insbesondere, da nicht jeder getestet wird. Man kann stattdessen auch die Entwicklung der bestätigt Infizierten betrachten. Diese empirische Funktion wird durch die Daten, die jeden Tag das Robert-Koch-Institut übermittelt, beschrieben, und ist so gesehen zunächst eine Abbildung von einer Anfangsmenge der natürlichen Zahlen (die ersten Tage seit Ausbruch) in die natürlichen Zahlen, wobei jedem Tag die Anzahl der bis dahin Infizierten zugeordnet wird.
Wenn man zu den Daten aus verschiedenen Ländern (oder verschiedenen Wellen) den Verlauf skizziert, ergibt sich jeweils ein ähnliches Bild. Die Ausbreitung scheint einer Gesetzmäßigkeit zu folgen, die man in der mathematischen Modellierung verstehen möchte. Das bedeutet (in einem ersten Schritt), dass man die empirische Funktion, also das vorliegende Datenmaterial, durch eine mathematische Funktion, also einen funktionalen Ausdruck, annähern möchte, um so den qualitativen und den quantitativen Verlauf der Ausbreitung zu verstehen und auch Extrapolationen (Prognosen) formulieren zu können. Hierbei wird man den Definitionsbereich und den Wertebereich als die reellen Zahlen (oder Intervalle davon) und die Funktion als stetig oder differenzierbar ansetzen. Man kann mit verschiedenen Zeiteinheiten arbeiten und auch die Gesamtzahl absolut oder aber prozentual (bezogen auf die Erdbevölkerung, ein Land, ...) angeben. So oder so ergibt sich, dass der Verlauf gut durch eine Exponentialfunktion beschrieben werden kann, also von der Bauart
mit einer Basis ist. Welche Basis zu nehmen ist, hängt von der Skalierung und auch von länderspezifischen Gegebenheiten ab. Diese Basis ist äquivalent zum Verdoppelungszeitraum der Ausbreitung, man kann das eine aus dem andern berechnen, siehe Aufgabe.
Diese Modellierung ist bisher aber nur die Beobachtung einer Übereinstimmung einer mathematischen Funktionsklasse mit empirischen Funktionen. In einem zweiten Schritt kann man sich fragen, ob es „in der Natur der Sache liegt“, dass die Ausbreitung eines Virus exponentiell verläuft. Gibt es einen mathematischen Grund dafür, eine innere Dynamik, eine zu jedem Zeitpunkt gültige Gesetzmäßigkeit, die den Verlauf erklären kann? Die Antwort zu dieser Frage erfolgt im Rahmen der Theorie der gewöhnlichen Differentialgleichungen, und beruht auf einer einfachen Beobachtung. Wir nehmen die Funktion als differenzierbar an. Die Ableitung beschreibt dann den momentanen Zuwachs zu jedem Zeitpunkt, ist also ein Maß für die Neuansteckungen. Der naheliegende Ansatz ist nun zu sagen, dass zu jedem Zeitpunkt die Anzahl der Infizierten, also , proportional zur Anzahl der Begegnungen zwischen Infizierten und Nichtinfizierten ist und damit proportional zur Anzahl der Neuinfektionen, also zu (für Einschränkungen zu dieser Überlegung siehe weiter unten). Dies führt zur Beziehung
mit einem konstanten Proportionalitätsfaktor , der ein Maß für die Ansteckungswahrscheinlichkeit ist und vom Virus, der Saison, vom Abstandsverhalten der Bevölkerung u. Ä. abhängt. Wir haben also eine Beziehung zwischen der gesuchten Funktion und ihrer Ableitung, die in jedem Moment gilt und für die Ausbreitung eines Virus charakteristisch sein sollte. Ein solcher Zusammenhang zwischen einer Funktion und ihrer Ableitung heißt eine gewöhnliche Differentialgleichung. Wenn eine solche Differentialgleichung vorliegt, fragt man sich, welche Funktionen diese Gleichung erfüllen. Dies ist im Allgemeinen schwierig. Im vorliegenden Fall lässt sich direkt durch Ableiten bestätigen, dass die Funktionen
mit Lösungen sind. Der Vorfaktor ist dabei durch
festgelegt, also durch den Wert der Funktion zum Zeitpunkt , und das im Exponenten ist direkt der Proportionalitätsfaktor aus der Differentialgleichung. Wegen
ist der Vorfaktor im Wesentlichen eine Verschiebung im Zeitargument, und kann man durch eine Umskalierung der Zeit zu normieren. Man kann nun sogar zeigen, dass die Exponentialfunktionen die einzigen Funktionen sind, die diese Differentialgleichung erfüllen, siehe Aufgabe bzw. Aufgabe. Dies bedeutet, dass eine Virusausbreitung durch den Faktor und dem Wert an einem einzigen Zeitpunkt eindeutig bestimmt ist. Dies ist ein Spezialfall des Satzes, dass ein Anfangswertproblem eine eindeutige Lösung besitzt, von dem wir verschiedene Varianten kennenlernen werden.
Kommen wir nun zu einigen Einschränkungen der oben formulierten Modellierung. Zunächst ist klar, dass die Exponentialfunktion zu jeder Basis gegen unendlich geht, es aber nur endlich viele Menschen gibt. Also kann irgendwas nicht stimmen. Der Punkt ist, dass in unserer Modellierung die Anzahl der Infizierten zur Anzahl der Begegnungen von Infizierten mit der Gesamtbevölkerung proportional ist, aber nicht mit der Anzahl der Begegnungen mit den Nichtinfizierten. Dieser Unterschied ist zu Beginn der Ausbreitung unerheblich, da zu Beginn die Gesamtbevölkerung nahezu vollständig nicht infiziert ist. Im Verlauf der Epidemie, wenn sich der Durchseuchungsgrad erhöht, wird es zunehmend wahrscheinlicher, dass sich Infizierte und Infizierte begegnen, was zu keiner Neuansteckung führt.
Ferner haben wir ignoriert, dass die Genesenen nicht mehr andere Leute anstecken können. Hier muss man den Unterschied zwischen infiziert und akut infiziert berücksichtigen. Dieser Unterschied ist für den Anfangsverlauf der Ausbreitung ebenfalls unerheblich, spielt aber im späteren Verlauf eine wichtige Rolle. Die Neuansteckung ist also proportional zur Anzahl der akut Infizierten, dies ist die Differenz zwischen der Gesamtinfiziertenzahl und der Gesamtinfiziertenzahl vor einem gewissen Genesungszeitraum (bei Corona ca. Wochen). Dies führt auf die Bedingung
man spricht von einer Differentialgleichung mit Verzögerung, was wir nicht behandeln werden. Für den ersten Zeitraum der Länge nach Ausbruch spielt der Korrekturterm aber keine Rolle.
Schließlich ist der Faktor keine Konstante, sondern wird durch politische Maßnahmen und Verhaltensregeln beeinflusst.