Kurs:Mathematische Modellbildung/Themen/Fake News in Sozialen Medien

Modellierungsproblem

Bearbeiten

Vor ein paar Jahren taucht der Begriff der "Fake News" immer öfter auf und seit dem begegnet uns dieser fast täglich. Vor allem bei politischen Themen kann man immer wieder auf Fake News stoßen. Diese werden oft auf Social Media Plattformen veröffentlicht und verbreitet. Das führt dazu, dass die Fake News schnell und weit verbreitet werden können. In unserer Modellierung werden wir den Verbreitungsprozess von Fake News darstellen. Zusätzlich werden wir Bekämpfungsmöglichkeiten für die Verbreitung anschauen und wie sich diese auf die Verbreitung der Fake News auswirken können. Die Modellierung hat als Ziel herauszufinden, welche der betrachteten Bekämpfungsmöglichkeiten am wirkungsvollsten sind und eine Empfehlung zum Umgang mit Fake News auf Social Media Plattformen zu geben. Dabei werden wir die Programme GeoGebra, Calc und Maxima verwenden.

Gruppenmitglieder

Bearbeiten
  • Alexander Blasius
  • Alina Bluhm
  • Theresa Krausewitz

Wiki2Reveal

Bearbeiten

Zuordnung zu Nachhaltigkeitszielen

Bearbeiten

Die Aufklärung über Fake News hat Auswirkungen auf deren Verbreitung. Das heißt man kann mit gezielten Bildungsmaßnahmen der schnellen Verbreitung von Fake News entgegenwirken.

Modellierungszyklen

Bearbeiten

Modellierungszyklus 1 - Niveau Sekundarstufe 1

Bearbeiten

Modellierung

Bearbeiten

Bei unserer Modellierung zur Darstellung der Verbreitung von Fake News betrachten wir zunächst eine Person, welche eine Fake News zum Zeitpunkt 1 an bis zu 5 Personen weiterleitet. Diese Personen leiten dieselbe Fake News zum Zeitpunkt 2 wieder an dieselbe Anzahl von Personen weiter. Dieser Vorgang wird genau so bis zum Zeitpunkt 10 wiederholt. So erhalten wir ein exponentielles Wachstum und können eine Exponentialfunktion bestimmen. Diese lautet:

  für 1<b<5

Um nun eine Kurve für die Verbreitung von Fake News zu modellieren, müssen wir die Summe der Weiterleitung zu jedem Zeitpunkt bilden. Für den Fall, dass eine Person eine Falschnachricht an 4 Personen weiterleitet, gilt b=4.

Weiterhin wollen wir die Verbreitung der Fake News unter den Aspekten einer Aufklärung der Personen, eines Löschvorgangs von Fake News, sowie einer Aufklärung und eines Löschvorgangs modellieren.

  • Aufklärung

Erfolgt eine Aufklärung der Personen, so leitet eine Person keine Falschnachrichten mehr weiter. Das heißt, unaufgeklärte Personen leiten eine Fake News an  -Personen weiter und aufgeklärte an keine mehr. Dabei gibt   die Anzahl der aufgeklärten Personen an. So haben wir immer nur  -Personen, welche die Fake News weiterleiten.

 

Für den Fall, dass eine Person ohne Aufklärung eine Fake News an 4 Personen weiterleitet, jedoch nach einer Aufklärung diese Falschnachricht an 2 Personen weniger weiterleitet, gilt b=4 und a=2.

  • Löschen

Erfolgt ein Löschvorgang einer Falschnachricht auf einer Plattform, kann diese Fake News jedoch weiterhin auf anderen Plattformen weitergeleitet werden. Allerdings ist die Wahrscheinlichkeit, dass eine Person diese Falschnachricht weiterleitet, geringer. Sie leitet diese also mit einer Wahrscheinlichkeit von l weiter. Dabei gilt 0<l<1 und wir erhalten folgende Funktion:

 

Für den Fall, dass eine Person eine Fake News an 4 Personen und einer Wahrscheinlichkeit von 0.3 weiterleitet, gilt b=4 und l=0.3

  • Aufklärung und Löschen

Erfolgt eine Aufklärung der Personen, sowie ein Löschvorgang einer Fake News auf einer Plattform, so leitet die Person weniger Falschnachrichten weiter. Die Weiterleitung einer Falschnachricht erfolgt zusätzlich noch mit einer geringeren Wahrscheinlichkeit. Diese Person leitet um den Parameter a und mit einer Wahrscheinlichkeit von l weniger Fake News weiter. Dabei gilt 0<l<1, sowie a≤b und wir erhalten folgende Funktion:

 

Wenn eine Person ohne Aufklärung und Löschvorgang eine Fake News an 4 Personen weiterleitet, jedoch nach einer Aufklärung diese Falschnachricht an 2 Personen weniger und dabei noch mit einer Wahrscheinlichkeit von 0.3 weiterleiten würde, gilt b=4, a=2 und l=0.3

Auswertung

Bearbeiten

Fake News

Für die Verbreitung der Fake News haben wir die Funktion   für  , wobei wir die Funktionswerte für b=4 genauer betrachtet haben.

x-Werte 0 1 2 3 4 5 6 7 8 9 10
  1 4 16 64 256 1024 4096 16384 65536 262144 1048576
Summe 1 5 21 85 341 1365 5461 21845 87381 349525 1398101

Betrachten wir die obige Tabelle, welche uns einen festen Zeitpunkt [x-Wert], die Anzahl der Personen, die die Fake News geschickt bekommen [f(x)] sowie die gesamte Anzahl der Fake News [Summe] angibt

Am Anfang zum Zeitpunkt 0 liegt eine Fake News bei einer Person vor. Diese leitet die Nachricht an vier weitere Personen weiter und so ergibt sich eine Anzahl von 5 Fake News. Diese vier Personen leiten die Nachricht wieder an jeweils vier andere Personen weiter, also insgesamt an 16 Personen, weshalb nun insgesamt 21 Fake News im Netzwerk sind. Diese setzen sich aus der ersten Person [eine Fake News], den vier Personen die von der ersten Person die Fake News weitergeleitet bekommen [4 Fake News] und den 16 Personen, welche von den vier Personen zum Zeitpunkt 2 die Fake News weitergeleitet bekommen [16 Fake News]. Insgesamt liegen zum Zeitpunkt 2 also 1+4+16=21 Fake News vor. Man erkennt, dass das Wachstum zunächst langsam ist, aber rapide ansteigt. So sind es zum Zeitpunkt 7 bereits 16384 Personen die eine Fake News geschickt bekommen und insgesamt im Netzwerk 21845. Zum nächsten Zeitpunkt wächst die Anzahl um mehr als das 4-fache auf 87381 Fake News an. Zum Zeitpunkt 10 sind es dann schon 1398101 Fake News im Netzwerk.

Aufklärung

Für die Aufklärung haben wir folgende Funktion für die Verbreitung der Fake News:

 

Hier wird ein Wert a, der kleiner gleich b ist, von b subtrahiert. Dies bedeutet, dass eine aufgeklärte Person, statt wie zuvor eine Nachricht an vier Personen weiterzuleiten, diese nur noch an (b-a)-Personen weiterleitet.

Wir haben hier den Fall   und   genauer betrachtet, also  .

Dadurch erhalten wir folgende Werte in unserer Tabelle:

x-Werte 0 1 2 3 4 5 6 7 8 9 10
  1 2 4 8 16 32 64 128 256 512 1024
Summe 1 3 7 15 31 63 127 255 511 1023 2047

Betrachtet man die Anzahl der Personen, welche zu einem festen Zeitpunkt x eine Fake News zugeschickt bekommen, erkennt man, dass die Werte deutlich geringer sind. Durch Quadrieren der Werte von g(x) erhalten wir f(x). Deswegen ist die Summe der Fake News im Netzwerk auch deutlich geringer. So sind zum Zeitpunkt 6 5461 Fake News im Netztwerk ohne die Aufklärung und mit der Aufklärung nur 127. Zum Zeitpunkt 10 wird das Ausmaß noch deutlicher, denn hier sind im Netzwerk mit Aufklärung 1.396.054 Fake News weniger enthalten.

Löschen

Als nächstes betrachten wir den Fall, dass eine Fake News auf einer Plattform gelöscht wird, jedoch noch über andere Plattformen verbreitet werden kann. Hierfür gibt es einen Parameter   für den gilt:  , welcher die Wahrscheinlichkeit angibt mit der eine Person eine Falschnachricht weiterleitet.

Es ergibt sich die Funktion  . Wir betrachten hier den Fall b=4 und l=0,3 genauer und erhalten folgende Tabelle:

x-Werte 0 1 2 3 4 5 6 7 8 9 10
  0.3 1.2 4.8 19.2 76.8 307.2 1228.8 4915.2 19660.8 78643.2 314572.8
Summe 0.3 1.5 6.3 25.5 102.3 409.5 1638.3 6553.5 26214.3 104857.5 419430.3

Da die Wahrscheinlichkeit der Weiterleitung hier 0,3 beträgt, beträgt die Summe der Fake News im Vergleich zur normalen Verbreitung nur 30%. Durch das Löschen sind also 70% weniger Fake News im Umlauf, aber im Vergleich zu der Aufklärung ist dieser Parameter bei weitem nicht so effektiv.

Aufklärung und Löschen

Im folgenden Fall führen wir den Parameter der Aufklärung und des Löschens zusammen. Dadurch ergibt sich die Funktion  . Wir betrachten wieder den Fall für l=0,3 b=4 und a=2 genauer.

Dadurch ergibt sich folgende Tabelle:

x-Werte 0 1 2 3 4 5 6 7 8 9 10
  0.3 0.6 1.2 2.4 4.8 9.6 19.2 38.4 76.8 153.6 307.2
Summe 0.3 0.9 2.1 4.5 9.3 18.9 38.1 76.5 153.3 306.9 614.1

Wie man erkennen kann, ist hier die Summe der Fake News am Geringsten. Zum Zeitpunkt x=10 beträgt die Anzahl der Fake News nur noch 614.1, was weniger als 0.05% der Anzahl ohne Aufklärung ausmacht.


Vergleich

 
 

Vergleicht man die vier Funktionen miteinander, so lässt sich einiges über das Wachstum sagen, welches die Weiterleitungen der Fake News zu einem gewissen Zeitpunkt x angibt.

In unseren Abbildungen ist f(x) grün, g(x) rot, h(x) blau und i(x) gelb.

Für:

  •   wird die Anzahl der Weiterleitung jedes mal mit b multipliziert, weshalb das Wachstum immer größer wird und damit auch die weitergeleiteten Fake News.
  •   wird die Anzahl der Weiterleitungen geringer, da nur noch mit (b-a) multipliziert wird und das Wachstum geringer ist. Im Fall b=4 und a=2 ist das Wachstum um 50% geringer.
  •   wird die Anzahl der Weiterleitungen im Vergleich zu der normalen Verbreitung ohne Parameter um den Faktor l kleiner. Da dieser zwischen 0 und 1 liegt, werden die Werte auf jeden Fall kleiner. Jedoch ist das Löschen allein nicht so effektiv, da das Wachstum exponentiell ist und die Multiplikation mit l ab einem gewissen Punkt nicht mehr so schwer ins Gewicht fällt.
  •   ist die Anzahl der Weiterleitungen am Geringsten, da die Anzahl der Weiterleitungen durch die Aufklärung am Geringsten war und jetzt durch das Löschen noch 70% weniger Fake News weiterverbreitet werden.
x-Werte 2 6 10
Summe Fake News 21 5461 1398101
Summe Aufklärung 7 127 2047
Summe Löschen 6.3 1638.3 419430.3
Summe Aufklärung & Löschen 2.1 38.1 614.1

Wie dieser Vergleich übersichtlich darstellt, sind die Methoden der Aufklärung und die des Aufklärens in Kombination mit dem Löschen am effektivsten. Dabei enthält die Kombination aus Aufklärung und Löschen nochmals um 70% weniger Fake News im Netzwerk, als nur die Aufklärung, welche weniger als 0.2% der Anzahl der Fake News ohne Parameter enthält.

Probleme der Modellierung

Bearbeiten

In unserer Modellierung gehen wir davon aus, dass jede Person, welche eine Fake News erhält, diese an die gleiche Anzahl von Personen weiterleitet. Jedoch haben unterschiedliche Personen auch unterschiedlich viele Kontaktpersonen, an die sie Nachrichten weiterleiten würden. Es wäre also realitätsnaher wenn verschiedene Personen auch unterschiedlich oft eine Fake News weiterleiten.

Bei der Modellierung der Aufklärung kann nur zwischen aufgeklärten Personen und unaufgeklärten Personen unterschieden werden. Das bringt mehrere Probleme mit sich. Denn es wird davon ausgegangen, dass die aufgeklärten Personen alle Fake News erkennen können und umgekehr die unaufgeklärten Personen keine einzige Fake News erkennen. Aber auch aufgeklärten Personen kann es passieren, dass sie eine Fake News nicht erkennen. Umgekehrt gilt natürlich auch, dass eine nicht aufgeklärte Person eine Fake News erkennen kann. Außerdem können Personen ein unterschiedliches Niveau an Aufklärung bezüglich eines Themas aufweisen und nicht nur 100% oder 0%. Hier müsste besser unterschieden werden.

In der Realität verliert eine Nachricht, egal ob Fake News oder nicht, mit der Zeit ihre Relevanz. Da wir hier aber mit Exponentialfunktionen arbeiten, kann das nicht modelliert werden. Das heißt die Fake News verbreiten sich immer weiter auch wenn der Inhalt mit der Zeit weniger relevant wird und dann sehr wahrscheinlich weniger oder gar nicht mehr weitergeleitet werden.

Software

Bearbeiten
  • GeoGebra

Modellierungszyklus 2 - Niveau Sekundarstufe 2

Bearbeiten

Modellierung

Bearbeiten

Zur Modellierung der Verteilung von Fake News benötigten wir zuerst ein soziales Gefüge von verschiedenen Personen. Wir betrachten für diesen Zyklus ein geschlossenes Netzwerk bestehend aus 20 Personen. Dabei wurden die Personen mit den Zahlen 1 bis 20 durchnummeriert. Für diese 20 Personen haben wir festgelegt, wer mit wem in Kontakt steht. Dazu haben wir die 20 Personen in 7 Freundeskreise (FK) zugeteilt, in denen untereinander alle in Kontakt stehen. Einzelne Personen sind in zwei Freundeskreisen vertreten, wodurch verschiedene Freundeskreise miteinander kommunizieren können.

  • FK 1: 2,3,5,7,11
  • FK 2: 4,6,8
  • FK 3: 1,9,10,12
  • FK 4: 13,14,15
  • FK 5: 16,17,18,19,20
  • FK 6: 2,4,16
  • FK 7: 10,12,13,15

Um die Kommunikation zwischen den einzelnen Personen darstellen zu können, haben wir eine 20x20 Matrix erstellt. In den einzelnen Spalten kann man ablesen, wie viel Kontakt die Person mit den anderen 19 Personen hat. Die Einträge liegen dabei immer zwischen 0 und 1. Dabei bedeutet die O, dass die Person mit einer anderen Person des Netzwerks keinen Kontakt hat. Sobald der Eintrag größer als 0 ist, hat die Person zu der anderen Person Kontakt. Die Zahlen sind dann wie folgt zu interpretieren: Ist zum Beispiel eine 0,7 eingetragen, dann leitet die Person 70% der Nachrichten, welche sie vorliegen hat, an die andere Person weiter. Auf der Diagonalen der Matrix ist immer eine 0 eingetragen, da die Personen keine Nachrichten an sich selbst weiterleiten. Unter Nachrichten werden alle Mitteilungen, welche eine sachliche Information enthalten, verstanden. Mit Hilfe der oben aufgezählten Freundeskreise haben wir unsere Matrix erstellt. Die Matrix stellt das Weiterleitungsverhalten der 20 Personen pro Stunde dar. Zuerst haben wir in die Stellen der Matrix eine 0 eingetragen, wenn eine Person mit einer weiteren Person keinen Kontakt hat. Dann haben wir für die übrig gebliebenen Stellen der Matrix jeweils eine Zufallszahl zwischen 0 und 1 generieren lassen.

Matrix 1

 

Beispiel zur Interpretation der Einträge in der Matrix: In der Matrix ist zu erkennen, dass Person 6 nur mit den Personen 4 und 8 in Kontakt steht. Denn in den Zeilen 4 und 8 der Matrix sind die Werte 0,9 und 0,5 eingetragen. Das bedeutet, dass Person 6 von den ihr vorliegenden Nachrichten 90% an Person 4 und 50% an Person 8 weiterleitet. In allen anderen Zeilen ist eine 0 eingetragen, somit besteht auch kein Kontakt zu diesen Personen.

Des Weiteren haben wir noch zwei Matrizen erstellt. Würde man die Modellierung nur mit einer einzigen Matrix durchführen, vermehren sich die Nachrichten sehr schnell in dem vorliegenden Netzwerk. Das bedeutet das bei einer Person eine einzige Nachricht sehr oft vorliegen würde und diese von der Person auch immer wieder weiterleiten würde. Dies entspricht aber nicht dem realen Verhalten einer Person. Damit sich die Modellierung näher am realen Verhalten orientiert, haben wir mit Hilfe der Matrix 1 die beiden Matrizen Matrix 2 und Matrix 3 erstellt.

Um die zweite Matrix zu erhalten, haben wir die Einträge der ersten Matrix halbiert.

Matrix 2

 

Um die dritte Matrix zu erhalten, haben wir die Einträge der zweiten Matrix mit 0,2 multipliziert.

Matrix 3

 

Das bewirkt, dass Nachrichten mit der Zeit weniger oft weitergeleitet werden.

Modellierung der Verteilung der Nachrichten im Netzwerk
Bearbeiten

Die eigentliche Modellierung haben wir damit begonnen, indem wir die Verteilung der Nachrichten im vorliegenden Netzwerk betrachtet haben. Dazu haben wir einen Vektor mit 20 Zeilen erstellt. Die Einträge in den Zeilen wurden wieder durch das Generieren von Zufallszahlen festgelegt. Diesmal liegen die Einträge jedoch zwischen 0 und 100. In diesem Vektor lässt sich ablesen, wie viele Nachrichten zu Beginn der Modellierung bei den einzelnen Personen vorliegen.

Startvektor

  

Beispiel zur Interpretation des Vektors: Im Vektor ist zu erkennen, dass der Person 5 zum Beginn der Modellierung 27 unterschiedliche Nachrichten vorliegen.

Die Modellierung betrachtet nun die Verteilung der Nachrichten stundenweise nach deren Beginn. Zu Beginn der Modellierung liegen im gesamten Netzwerk 953 Nachrichten vor. Um die Anzahl der Nachrichten nach der ersten Stunde bestimmen zu können, multipliziert man die erste Matrix mit dem Startvektor. Dadurch erhält man einen neuen Vektor. Dieser gibt an, wie viele Nachrichten nach einer Stunde bei den einzelnen Personen vorliegen. Wichtig dabei zu beachten ist, dass hier keine neuen Nachrichten dazugekommen sind, sondern nur die schon zu Beginn existierenden Nachrichten durch das Weiterleiten vermehrt wurden. Das heißt, dass die Nachrichten auch mehrfach im Netzwerk und bei einzelnen Personen ankommen. Addiert man nun die Einträge des neuen Vektors, erkennt man, dass nun 2498 Nachrichten im gesamten Netzwerk zu finden sind. In jeder Stunde der Modellierung wird ein neuer Vektor mit Hilfe der Zufallszahlen generiert, da davon ausgegangen werden muss, dass immer wieder neue Nachrichten in das Netzwerk gelangen. In der ersten Stunde gelangen zusätzlich 1107 Nachrichten in das Netzwerk. Insgesamt liegen also nach der ersten Stunde 3605 Nachrichten vor. Ab jetzt muss aufgepasst werden, welche Matrix mit welchem Vektor multipliziert werden muss. Ein Vektor wird immer zuerst mit Matrix 1, dann mit Matrix 2 und das letzte Mal mit Matrix 3 multipliziert. Nach der dritten Multiplikation wird der Vektor in der nächsten Stunde nicht weiter betrachtet, da die aufgezählten Nachrichten von den Personen sehr wahrscheinlich nicht mehr weitergeleitet werden. Denn diese müssten mittlerweile bei jeder Person mehrfach angekommen sein und sind somit als veraltet anzusehen. Im nächsten Schritt wird die zweite Matrix mit dem veränderten Startvektor und die erste Matrix mit dem Vektor für Stunde 1 multipliziert. Zusätzlich wird wieder ein neuer Vektor für Stunde 2 generiert. Somit liegen nach zwei Stunden insgesamt 7449,105 Nachrichten vor.

Für die dritte Stunde werden folgende Multiplikationen durchgeführt:

Matrix 3* (veränderter) Startvektor

Matrix 2* (veränderter) Vektor für Stunde 1

Matrix 1* Vektor für Stunde 2

Außerdem wird ein neuer Vektor für Stunde 3 erstellt. Insgesamt befinden sich nach drei Stunden 9108,01315 Nachrichten im Netzwerk. Bei der Betrachtung der vierten Stunde wird nun der Startvektor nicht weiter berücksichtigt, da dieser schon mit allen drei Matrizen multipliziert wurde.

 

Die folgenden Multiplikationen sind für die vierte Stunde nötig:

Matrix 3*(veränderter)Vektor für Stunde 1

Matrix 2*(veränderter) Vektor für Stunde 2

Matrix 1*Vektor für Stunde 3

Auch hier wird wieder ein neuer Vektor für Stunde 4 dazu genommen. Nach vier Stunden liegen 8516,3724 Nachrichten vor. Diese Modellierung kann für die nächsten Stunden genau so weitergeführt werden.

Am Anfang unserer Modellierung befinden sich 953 Nachrichten im Umlauf. Nach der ersten Stunde liegt die Anzahl der Nachrichten dann schon bei 2964. Davon sind 1107 Nachrichten neu hinzugekommen. Somit wurden die 953 Nachrichten vom Beginn auf 1857 Nachrichten vervielfältigt. Von Stunde 1 zu Stunde 2 wurden es dann schon 5145 Nachrichten. Nach einer weiteren Stunde stieg die Anzahl auf 5565 Nachrichten. Am Ende der vierten Stunde wurden 6123 Nachrichten in unserem Netzwerk verteilt.

Betrachtung der Verteilung von Fake News
Bearbeiten

1.Modellierung mit Hilfe der Verteilung der Nachrichten im Netzwerk

In unserer Modellierung sollen die Fake News im Vordergrund stehen. Deshalb haben wir im nächsten Schritt betrachtet, wie sich die Fake News in unserem Netzwerk verteilen. Davon ausgehend, dass von den Nachrichten, die in das Netzwerk zu Beginn und nach den einzelnen Stunden gelangen, 5% Fake News sind, haben wir uns die Verteilung der Fake News angeschaut. Außerdem haben wir angenommen, dass die Nachrichten, welche von den Personen weitergeleitet werden, immer zu 5% Fake News enthalten. Unser Vorgehen war dabei wie folgt: Um Herauszufinden, wie viele Fake News zu Beginn vorhanden waren, haben wir den Startvektor mit 0,05 multipliziert. Der daraus neu entstandene Vektor gibt an, dass sich zu Beginn der Modellierung unter den Nachrichten 46 Fake News befinden. Hier haben wir uns immer auf die vorherige Modellierung der Verteilung der Nachrichten bezogen.

Nach der ersten Stunde waren folgende Multiplikationen notwendig um die Anzahl der Fake News herauszufinden:

(Veränderter) Startvektor* 0,05

Vektor für Stunde 1* 0,05

Insgesamt liegen dann nach einer Stunde 150 Fake News vor.


Nach der zweiten Stunde wurden folgende Multiplikationen durchgeführt:

(Veränderter) Startvektor* 0,05

(Veränderter) Vektor für Stunde 1* 0,05

Vektor für Stunde 2* 0,05

Anzahl der Fake News nach zwei Stunden: 259


Nach der dritten Stunde wurden folgende Multiplikationen durchgeführt:

(Veränderter) Startvektor* 0,05

(Veränderter) Vektor für Stunde 1* 0,05

(Veränderter) Vektor für Stunde 2* 0,05

Vektor für Stunde 3* 0,05

Anzahl der Fake News nach drei Stunden: 280


Nach der vierten Stunde wurden folgende Multiplikationen durchgeführt:

(Veränderter) Vektor für Stunde 1* 0,05

(Veränderter) Vektor für Stunde 2* 0,05

(Veränderter) Vektor für Stunde 3* 0,05

Vektor für Stunde 4* 0,05

Anzahl der Fake News nach vier Stunden: 424


2. Modellierung unabhängig von der vorherigen Verteilung der Nachrichten im Netzwerk

Um zu überprüfen ob unsere erste Modellierung anhand der Verteilung der Nachrichten auch stimmt, haben wir die Verteilung der Fake News im Netzwerk nochmal unabhängig von der Modellierung der Verteilung der Nachrichten im Netzwerk durchgeführt. Damit wir anschließend auch vergleichen konnten, ob unsere vorherige Modellierung bezüglich der Fake News stimmt, verwendeten wir den selben Startvektor. Das heißt auch hier lagen zu Beginn 46 Fake News im gesamten Netzwerk vor. Diese Modellierung läuft identisch zur Modellierung der Verteilung der Nachrichten im Netzwerk ab. Nach der ersten Stunde wurden folgende Multiplikationen durchgeführt:

Matrix 1* Startvektor Fake News

Außerdem wurde der Vektor, welcher die neuen Fake News in Stunde eins angibt aus der ersten Modellierung bezüglich der Fake News übernommen. Auch hier mit dem Zweck um am Ende die Ergebnisse der beiden Modellierungen vergleichen zu können. Somit befanden sich nach einer Stunde insgesamt 147 Fake News im Umlauf.


Nach der zweiten Stunde wurden folgende Multiplikationen durchgeführt (Fake News wird hier mit FN abgekürzt):

Matrix 2* (Veränderter) Startvektor FN

Matrix 1* Vektor für Stunde 1 FN

Hinzufügen des Vektors für Stunde 2 bezüglich der Fake News. Anzahl der Fake News nach zwei Stunden: 259

 


Nach der dritten Stunde wurden folgende Multiplikationen durchgeführt:

Matrix 3* (Veränderter) Startvektor FN

Matrix 2* (Veränderter) Vektor für Stunde 1 FN

Matrix 1* Vektor für Stunde 2 FN

Hinzufügen des Vektors für Stunde 3 bezüglich der Fake News. Anzahl der Fake News nach drei Stunden: 288


Nach der vierten Stunde wurden folgende Multiplikationen durchgeführt:

Matrix 3* (Veränderter) Vektor für Stunde 1 FN

Matrix 2* (Veränderter) Vektor für Stunde 2 FN

Matrix 1* Vektor für Stunde 3 FN

Hinzufügen des Vektors für Stunde 4 bezüglich der Fake News. Anzahl der Fake News nach vier Stunden: 277

Aufklärung
Bearbeiten

Um unsere Modellierung realistischer zu gestalten, haben wir den Parameter der Aufklärung hinzugefügt. Hier geht es darum, wie sich die Verbreitung der Fake News verändert, wenn Personen über die Verbreitung und auch das Erkennen der Fake News aufgeklärt werden würden. Durch die Aufklärung würde eine Person weniger Falschmeldungen weiterleiten. Da die Personen sich intensiver mit den Nachrichten beschäftigen und gegebenenfalls erkennen, dass es sich um Fake News handelt.

Hierfür hat jede Person eine zufällige Zahl zwischen 0 und 1, den Aufklärungsparameter, zugewiesen bekommen. Danach wurden die einzelnen Spalten unserer Anfangsmatrix mit dem jeweiligen Aufklärungsparameter multipliziert. Die Matrix beschreibt das Weiterleitungsverhalten nach der Aufklärung der 20 Personen.

Aufklärungsparameter

Der Vorgang läuft folgendermaßen:

Person 1 bekommt den zufälligen Aufklärungsparameter 0,8 zugewiesen. Dieser Wert wird mit der ersten Spalte von Matrix 1 multipliziert und ergibt die erste Spalte der Aufklärungsmatrix.

Person 2 bekommt den zufälligen Aufklärungsparameter 0,3 zugewiesen. Dieser Wert wird mit der zweiten Spalte von Matrix 1 multipliziert und ergibt die zweite Spalte von der Aufklärungsmatrix.

Dieser Vorgang wird wiederholt bis wir zum Schluss den Aufklärungsparameter von Person 20 mit den 20. Spalte von Matrix multiplizieren und unsere neue 20x20 Matrix vollständig ist.

Aufklärungsmatrix 1

 

Um die Aufklärungsmatrix 2 zu erhalten, wird die Aufklärungsmatrix 1 mit 0.5 multipliziert.

Aufklärungsmatrix 2

 

Für die Aufklärungsmatrix 3, multiplizieren wir Aufklarungsmatrix 2 mit 0.2.

Aufklärungsmatrix 3

 

So erhalten wir insgesamt drei neue Matrizen mit kleineren Werten. Die kleineren Werte bedeuten, dass eine Person einen geringeren Anteil der Fake News an eine Andere weiterleitet.


Nach der ersten Stunde werden folgende Multiplikationen durchgeführt:

Aufklärungsmatrix 1* Startvektor FN (V0) = Startvektor FN (V1)

Hinzufügen des Vektors für Stunde 1 FN (V0).

Insgesamt liegen dann nach einer Stunde 110 Fake News vor.


Nach der zweiten Stunde wurden folgende Multiplikationen durchgeführt:

Aufklärungsmatrix 2* Startvektor FN (V1) = Startvektor FN (V2)

Aufklärungsmatrix 1* Vektor für Stunde 1 (V0) = Vektor für Stunde 1 (V1)

Hinzufügen des Vektors für Stunde 2 (V0).

Anzahl der Fake News nach zwei Stunden: 160

 


Nach der dritten Stunde wurden folgende Multiplikationen durchgeführt:

Aufklärungsmatrix 3* Startvektor FN (V2) = Startvektor FN (V3)

Aufklärungsmatrix 2* Vektor für Stunde 1 (V1) = Vektor für Stunde 1 (V2)

Aufklärungsmatrix 1* Vektor für Stunde 2 (V0) = Vektor für Stunde 2 (V1)

Hinzufügen des Vektors für Stunde 3 (V0).

Anzahl der Fake News nach drei Stunden: 157


Nach der vierten Stunde wurden folgende Multiplikationen durchgeführt:

Aufklärungsmatrix 3* Vektor für Stunde 1 (V2) = Vektor für Stunde 1 (V3)

Aufklärungsmatrix 2* Vektor für Stunde 2 (V1) = Vektor für Stunde 2 (V2)

Aufklärungsmatrix 1* Vektor für Stunde 3 (V0) = Vektor für Stunde 3 (V1)

Hinzufügen des Vektors für Stunde 4 (V0)

Anzahl der Fake News nach vier Stunden: 145

Löschen
Bearbeiten

Bei unserer Modellierung soll auch die Veränderung der Verbreitung der Fake News im Hinblick auf Löschen der im Netzwerk kursierenden falschen Nachrichten betrachtet werden. Dabei wollen wir deutlich machen, wie sich die Verbreitung der Fake News alleine durch Löschen von 25% der Falschmeldungen auswirkt. Dafür sind wir wie folgt vorgegangen: Zuerst haben wir die Matrizen, den Startvektor, sowie die Vektoren der neuen Fake News pro Stunde übernommen.


Nach der ersten Stunde waren folgende Multiplikationen notwendig um die Anzahl der Fake News nach einem Löschvorgang herauszufinden:

Matrix 1* Startvektor FN (V0) = Startvektor FN (V1)

Startvektor FN (V1)* 0,75 = Startvektor FN (L1)

Hinzufügen des Vektors für Stunde 1 bezüglich der Fake News. Insgesamt liegen dann nach einer Stunde 162 Fake News vor.


Nach der zweiten Stunde wurden folgende Multiplikationen durchgeführt:

Matrix 2* Startvektor FN (L1) = Startvektor FN (V2)

Startvektor FN (V2)* 0,75 = Startvektor FN (L2)

Matrix 1* Vektor für Stunde 1 FN (V0) = Vektor für Stunde 1 FN (V1)

Vektor für Stunde 1 FN (V1)* 0,75 = Vektor für Stunde 1 FN (L1)

Hinzufügen des Vektors für Stunde 2 bezüglich der Fake News. Anzahl der Fake News nach zwei Stunden: 257


Nach der dritten Stunde wurden folgende Multiplikationen durchgeführt:

Matrix 3* Startvektor FN (L2) = Startvektor FN (V3)

Startvektor FN (V3)* 0,75= Startvektor FN (L3)

Matrix 2* Vektor für Stunde 1 FN (L1) = Vektor für Stunde 1 FN (V2)

Vektor für Stunde 1 FN (V2)* 0,75 = Vektor für Stunde 1 FN (L2)

Matrix 1* Vektor für Stunde 2 FN (V0) = Vektor für Stunde 2 FN (V1)

Vektor für Stunde 2 FN (V1)* 0,75 = Vektor für Stunde 2 FN (L1)

 

Hinzufügen des Vektors für Stunde 3 bezüglich der Fake News. Anzahl der Fake News nach drei Stunden: 256


Nach der vierten Stunde wurden folgende Multiplikationen durchgeführt:

Matrix 3* Vektor für Stunde 1 FN (L2) = Vektor für Stunde 1 FN (V3)

Vektor für Stunde 1 FN (V3)* 0,75 = Vektor für Stunde 1 FN (L3)

Matrix 2* Vektor für Stunde 2 FN (L1) = Vektor für Stunde 2 FN (V2)

Vektor für Stunde 2 FN (V2)* 0,75 = Vektor für Stunde 2 FN (L2)

Matrix 1* Vektor für Stunde 3 FN (V0) = Vektor für Stunde 3 FN (V1)

Vektor für Stunde 3 FN (V1)* 0,75 = Vektor für Stunde 3 FN (L1)

Hinzufügen des Vektors für Stunde 3 bezüglich der Fake News. Anzahl der Fake News nach vier Stunden: 212

Aufklärung und Löschen
Bearbeiten

Zum Schluss unserer Modellierung möchten wir auch noch die Veränderung der Verbreitung der Fake News mit Blick auf einen Löschvorgang und einer Aufklärung der Personen betrachten. Dabei wollen wir deutlich machen, wie sich die Fake News durch Löschen von 25% der Falschmeldungen und einer Aufklärung der Personengruppe mithilfe des Aufklärungsvektors auswirkt. Dafür sind wir wie folgt vorgegangen: Zuerst haben wir die Aufklärungsmatrizen, den Startvektor, sowie die Vektoren der neuen Fake News pro Stunde übernommen.


Nach der ersten Stunde waren folgende Multiplikationen notwendig um die Anzahl der Fake News herauszufinden:

Aufklärungsmatrix 1* Startvektor FN (V0) = Startvektor FN (V1)

Startvektor FN (V1)* 0,75 = Startvektor FN (L1)

Insgesamt liegen dann nach einer Stunde 99 Fake News vor.


Nach der zweiten Stunde wurden folgende Multiplikationen durchgeführt:

Aufklärungsmatrix 2* Startvektor FN (L1) = Startvektor FN (V2)

Startvektor FN (V2)* 0,75 = Startvektor FN (L2)

Aufklärungsmatrix 1* Vektor für Stunde 1 FN (V0) = Vektor für Stunde 1 FN (V1)

Vektor für Stunde 1 FN (V1)* 0,75 = Vektor für Stunde 1 FN (L1)

Anzahl der Fake News nach zwei Stunden: 132

 


Nach der dritten Stunde wurden folgende Multiplikationen durchgeführt:

Aufklärungsmatrix 3* Startvektor FN (L2) = Startvektor FN (V3)

Startvektor FN (V3)* 0,75= Startvektor FN (L3)

Aufklärungsmatrix 2* Vektor für Stunde 1 FN (L1) = Vektor für Stunde 1 FN (V2)

Vektor für Stunde 1 FN (V2)* 0,75 = Vektor für Stunde 1 FN (L2)

Aufklärungsmatrix 1* Vektor für Stunde 2 FN (V0) = Vektor für Stunde 2 FN (V1)

Vektor für Stunde 2 FN (V1)* 0,75 = Vektor für Stunde 2 FN (L1)

Anzahl der Fake News nach drei Stunden: 125


Nach der vierten Stunde wurden folgende Multiplikationen durchgeführt:

Aufklärungsmatrix 3* Vektor für Stunde 1 FN (L2) = Vektor für Stunde 1 FN (V3)

Vektor für Stunde 1 FN (V3)* 0,75 = Vektor für Stunde 1 FN (L3)

Aufklärungsmatrix 2* Vektor für Stunde 2 FN (L1) = Vektor für Stunde 2 FN (V2)

Vektor für Stunde 2 FN (V2)* 0,75 = Vektor für Stunde 2 FN (L2)

Aufklärungsmatrix 1* Vektor für Stunde 3 FN (V0) = Vektor für Stunde 3 FN (V1)

Vektor für Stunde 3 FN (V1)* 0,75 = Vektor für Stunde 3 FN (L1)

Anzahl der Fake News nach vier Stunden: 103

Auswertung

Bearbeiten
Fake News
Stunden 0 1 2 3 4
Anzahl der Fake News 46 147 259 288 277

Zu Beginn liegen in dem Netzwerk 46 Fake News vor. Nach einer Stunde wird der Wert mehr als dreifach so groß und steigt auf 147. In der zweiten Stunde liegt der Wert bei 259 und ist dementsprechend prozentual weniger Angestiegen als nach der ersten Stunde. Bei Stunde 3 steigt der Wert noch auf 288 Fake News, also einen noch geringeren Anstieg. In der vierten Stunde ist dann die Anzahl der Fake News geringer als in Stunde 3.

Aufklärung
Stunden 0 1 2 3 4
Anzahl der Fake News 46 110 160 157 145

Zu Beginn liegen wieder 46 Fake News in unserem Netzwerk vor. Innerhalb der ersten Stunde steigt die Anzahl mehr als doppelt so hoch auf 110. In der zweiten Stunde findet nur noch ein Anstieg von circa 50% statt und es befinden sich 160 Fake News im Netzwerk. Die dritte und vierte Stunde kennzeichnen jeweils nochmal einen Abstieg der Fake News, wobei dieser immer geringer wird. Der Abstieg wird immer geringer, aber nähert sich einem festem Wert an, da stündlich noch neue Fake News in das Netzwerk hinzukommen.

Löschen
Stunden 0 1 2 3 4
Anzahl der Fake News 46 162 257 256 212

Zu Beginn liegen wieder 46 Fake News in unserem Netzwerk vor. In der ersten Stunde steigt die Anzahl der Fake News auf 162. Innerhalb der zweiten Stunde steigt der Wert das letzte mal und erreicht einen Wert von 257. Nach der zweiten Stunde beginnt der Wert zu fallen bzw. bleibt gleich. In der vierten Stunde beginnen die Fake News um einen größeren Anteil weniger zu werden. Hier liegt der Wert noch bei 212.

Aufklärung und Löschen
Stunden 0 1 2 3 4
Anzahl der Fake News 46 99 132 125 103

Zu Beginn liegen wieder 46 Fake News in unserem Netzwerk vor. In der ersten Stunde steigt die Anzahl der Fake News auf 99. Danach findet in der zweiten Stunde nochmal ein Anstieg statt und es befinden sich 132 Fake News im Netzwerk. Ab dann beginnt die Anzahl der Fake News zu fallen und erreicht in der dritten Stunde eine Anzahl von 125 und in der vierten Stunde 103.

 
Vergleich
Stunde 0 1 2 3 4
Fake News 46 147 259 288 277
Aufklärung 46 110 160 157 145
Löschen 46 162 257 256 212
Aufklärung und Löschen 46 99 132 125 103

Vergleicht man unsere drei Tabellen, erkennt man die Wirkungen unserer verschiedenen Parameter. Bleiben die Fake News ohne Einwirkung im Netzwerk, beginnen sie erst nach vier Stunden zu fallen. Diese Abstieg lässt sich darauf zurückführen, dass die Fake News nach einer gewissen Zeit schon bei zu vielen Personen im Netzwerk gelandet sind und deshalb nicht mehr weiter geschickt werden. Jedoch sind so trotzdem sehr viele Falschmeldungen in Umlauf und der Wert wird auch nicht viel geringer. Klärt man die Nutzer des Netzwerkes auf, lässt sich schon in der ersten Stunde ein Fortschritt erkennen, denn die Fake News sind schon fast zu einem Drittel weniger. Auch danach ist der Anstieg sehr viel geringer und schon nach der zweiten Stunde beginnen diese weniger im Netzwerk zu werden. Jedoch wird der Abstieg der Fake News immer geringer und nähern sich einem Wert an. Mit dem Löschen der Fake News lässt sich in der ersten Stunde keine Verbesserung erkennen. Auch in der zweiten Stunde ist die Anzahl fast gleich. Erst ab der dritten Stunde wird die Anzahl der Fake News geringer oder stagniert. In der vierten Stunde lässt sich dann ein deutlicherer Abstieg erkennen. Kombiniert man das Aufklären mit dem Löschen lassen sich die besten Ergebnisse erzielen. Schon innerhalb der ersten Stunde verbreiten sich die Fake News nicht zu stark wie sonst. Auch in der zweiten Stunde steigt die Anzahl vergleichsweise sehr wenig und fällt auch danach wieder ab. So befinden sich nach vier Stunden nur noch 103 Fake News in unserem Netzwerk, was im Vergleich zu den 277, ohne Eingreifen, einen Kleinteil ausmacht.

Probleme der Modellierung

Bearbeiten

Im folgenden werden die Probleme, welche uns bei der Modellierung begleitet und aufgefallen sind erläutert.

In unserer Modellierung beobachten wir die Weiterleitungen durch Personen pro Stunde. Diese stündliche Betrachtung ist jedoch in der Hinsicht problematisch, dass davon ausgegangen wird, dass jede Person in jeder Stunde gleich aktiv ist bezüglich der Weiterleitungen. Dies ist in der Realität jedoch nicht der Fall. Es müsste eigentlich davon ausgegangen werden, dass wenn die Personen beschäftigt sind weniger Zeit haben und sie somit auch weniger oder keine Weiterleitungen vornehmen. Diese Problem könnte man durch die Anpassung der Matrizen lösen. Hier für bräuchte man jedoch eine Vielzahl an neuen Matrizen, da auch weiter nicht davon ausgegangen werden kann, dass alle Personen zur selben Zeit gleich viel beschäftigt sind. Eine erste Annäherung könnte jedoch sein, dass man zwei unterschiedliche Matrizen erstellt. Eine könnte zur Modellierung des Vormittags dienen und eine weiter für den Nachmittag beziehungsweise Abend. Denn man kann in der Regel davon ausgehen, dass am Vormittag die Mehrheit der Personen auf Grund der Arbeit oder sonstiges weniger Zeit für die Weiterleitung von Nachrichten haben als nachmittags.

Ein weiteres Problem besteht darin, dass sich die Nachrichten durch die Weiterleitungen der Personen nicht nur einmal sondern mehrmals im Netzwerk vorliegen. Das kann dazu führen, dass bei einer einzelnen Person eine Nachricht auch mehrmals vorliegt. In der Realität würde die Person dann diese Nachricht nur einmal an eine oder mehrere Personen weiterleiten. Da aber in unserer Modellierung nicht erkannt wird, ob bei einer Person eine Nachricht mehrmals vorliegt, kann es sein, dass eine Person die selbe Nachricht an anderer Personen mehr als nur einmal weiterleitet. Dieses Problem ist uns schon während der Modellierung bewusst geworden, weshalb wir drei unterschiedliche Matrizen zur Modellierung verwendet haben um dieses Problem etwas abzuschwächen. Die Einträge der Matrizen eins bis drei werden immer geringer. Das hat den Grund, dass die Personen eine Nachricht, welche sie schon einmal weitergeleitet haben, sehr wahrscheinlich nicht mehr unbedingt weiterleiten. Das folgende Beispiel verdeutlich die beschriebene Situation: Zu Beginn unserer Modellierung befinden sich 46 Fake News in unserem Netzwerk. Hierbei handelt es sich um 46 unterschiedliche Fake News. Nach nur einer Stunde haben sich diese 46 Nachrichten zu 118 Nachrichten vervielfältigt. Das heißt es liegen Nachrichten mehr als einmal vor. Am Ende der zweiten Stunde haben sich die 118 nochmals auf 138 Nachrichten vervielfacht. Das heißt die ursprünglichen 46 Nachrichten wurden so oft weitergeleitet, dass diese jetzt 138 Mal vorliegen. Und hier liegt das Problem welches erläutert wurde. Dennoch kann man schon in der Vervielfältigung vom Beginn zu Stunde eins und von Stunde eins zu Stunde zwei erkennen, dass die Nachrichten sich bei der zweiten Weiterleitung sehr viel weniger schnell verbreiten als bei der Ersten. Das liegt an unserem Gegensteuern mit Hilfe der drei unterschiedlichen Matrizen. Diesen Effekt kann man jedoch noch besser nach der dritten Stunde erkennen. Denn nach drei Stunden liegen dann nur noch 34 Nachrichten vor.

Auf die nächste Schwierigkeit stießen wir bei der Modellierung des Löschens von Fake News. Die Idee hierbei war, dass die Betreiber einer Social Media Plattform Nachrichten, welche sie als Falschmeldung identifiziert haben, von ihrer Seite löschen können. Dann verhält es sich so, dass keiner der Nutzer dieser Plattform noch auf diese Falschmeldung zugreifen kann. Das konnten wir jedoch nicht genau so modellieren. Denn wir nehmen in unserer Modellierung an, dass nach jeder Stunde 25% der Fake News erkannt und gelöscht werden. Jedoch haben wir keine Kenntnis darüber, welche Nachrichten wie oft in unserem Netzwerk vorliegt. Das heißt wenn eine Falschmeldung in unserer Modellierung gelöscht wird, wissen wir nicht wie viele Weitere auf Grund dieser Löschung auch wegfallen müssten.

Software

Bearbeiten
  • LibreOffice Calc

Modellierungszyklus 3 - Niveau Uni

Bearbeiten

Auch in diesem Modellierungszyklus wird wieder ein soziales Gefüge betrachtet und wie sich in diesem Fake News verbreiten. Hier haben wir einfach das schon erstellte Netzwerk aus Modellierungszyklus 2 übernommen. Auch die Matrizen 1-3 haben wir unverändert weiter genutzt.

Benennungen der Matrizen, Vektoren und Funktionen

Bearbeiten

Um während unserer Modellierung in unserem Dokument in Maxima den Überblick behalten zu können, haben wir die einzelnen Matrizen, Vektoren und Funktionen benannt.

 

Erstellen der Matrizen

Bearbeiten

Im der zweiten Modellierung sind wir davon ausgegangen, dass die Personen in unserem Netzwerk zu jeder Zeit gleich aktiv bezüglich der Weiterleitung von Fake News sind. Jedoch haben wir schon im Absatz Probleme der Modellierung darauf hingewiesen, dass das nicht der Realität entsprechen kann. Diesen Gesichtspunkt wollen wir in diesem Modellierungszyklus in den Blick nehmen und verbessern.

Dazu haben wir die Aktivität am Handy an einem Tag betrachtet. Wir haben markanten Uhrzeiten eine Zahl zwischen 0 und 1 zugeordnet, welche die Aktivität am Handy und somit die Möglichkeit der Weiterleitung beschreibt zugeordnet. Dabei haben wir uns an besonderen Tageszeiten orientiert wie zum Beispiel das Aufstehen, der Arbeitsbeginn, die Mittagspause und der Feierabend. Beim Erstellen des Tagesablaufes ist uns aufgefallen, dass es des Weiteren sinnvoll ist auch zwischen einzelnen Wochentagen zu unterscheiden. Deshalb haben wir drei Tagesabläufe bezüglich der Aktivität am Smartphone erstellt.

Die folgende Tabelle beschreibt die Aktivität der Personen an den Wochentagen von Montag bis Donnerstag:

Uhrzeit 5 7 8 9,5 12,5 14 16,5 18 20,25 23
Aktivität 0 0,6 0,3 0,2 0,8 0,4 0,2 0,5 0,95 0,1

Eine eigene Tabelle haben wir für den Freitag angefertigt, da davon ausgegangen werden kann, dass die Arbeitszeit kürzer ist und damit auch das Nutzungsverhalten des Handys.

Uhrzeit 5 7 8 9,5 12,5 13 14,5 18 20,25 23 24
Aktivität 0 0,6 0,3 0,2 0,8 0,4 0,6 0,75 0,95 0,4 0,2

Die dritte und letzte Tabelle beschreibt den Samstag wie auch den Sonntag. Da hier von keinen Arbeitszeiten ausgegangen werden muss, ist auch die Aktivität am Handy verschieden zu den anderen Tagen.

Uhrzeit 5 7 9,5 11,5 12 14 16 18 20,25 24
Aktivität 0 0,1 0,8 0,5 0,3 0,6 0,9 0,8 0,4 0,1
 

Die Tabelle beschreiben jedoch nur einzelne ausgewählte Zeitpunkte des Tages. Jedoch soll in unserer Modellierung die stündliche Verbreitung von Fake News betrachtet werden. Aus diesem Grund haben wir die Punkte aus den Tabellen als Stützpunkte einer Lagrange-Interpolation genutzt. Somit haben wir drei Funktionen erhalten, mit welchen wir zu jeder beliebigen Tageszeit eine zugehörige Zahl, welche die Aktivität beschreibt, ermitteln können.


 

f(x):=Funktion für Montag bis Donnerstag

 
 

g(x):=Funktion für Freitag

 

h(x):=Funktion für Samstag und Sonntag

 

Wie oben schon erwähnt haben wir die drei Matrizen aus dem zweiten Modellierungszyklus übernommen. Die Einträge der drei Matrizen beschreiben ob eine Person mit einer weiteren Person in Kontakt steht und wenn ja in welcher Intensität. Diese Matrizen werden dann für jede einzelne Stunde mit der Zahl, welche die Aktivität am Handy beschreibt, multipliziert. So erhält man für jede Stunde das genaue Weiterleitungsverhalten der Fake News.

Möchte man die Matrizen erhalten, welche das Weiterleitungsverhalten am Donnerstag um 10 Uhr beschreiben erhalten, geht man wie folgt vor. Man setzt als x-Wert 10 in die Funktion f ein. Somit erhält man die Aktivität von 0.3301849414032244. Die drei Matrizen multipliziert man dann jeweils mit dieser Zahl und erhält drei neue Matrizen, welche einer genauen Tageszeit zugeordnet sind.

Verbreitung der Fake News

Bearbeiten

Die Modellierung der Verbreitung der Fake News funktioniert hier ähnlich wie im zweiten Modellierungszyklus. Also wird auch wieder stundenweise modelliert. Wie auch schon im der vorherigen Modellierung, gelangen pro Stunde jeweils neue Fake News in das Netzwerk und diese werden mit den drei unterschiedlichen Matrizen in den drei aufeinanderfolgenden Stunden multipliziert. Jedoch unterscheidet sich diese Modellierung in der Hinsicht zur zweiten, dass der Vektor, welcher die neuen Fake News der Stunde beschreibt, immer der selbe ist. Das liegt daran, dass in dieser Modellierung eine viel längere Zeitspanne betrachtet wird und es viel Aufwand bedeuten würde für jede Stunde einen neuen Vektor zu erstellen. Der wichtigste Grund für diese Änderung war allerdings die Übersichtlichkeit unserer Modellierung in Maxima. Aus dieser Änderung resultieren jedoch neue Probleme für die Modellierung. Diese werden im Abschnitt Probleme der Modellierung erläutert.

Vektor für die neuen Fake News pro Stunde

  

Die Modellierung hängt nun immer von dem Wochentag und der Uhrzeit ab. Möchte man den Vektor für eine bestimmte Uhrzeit an einem Wochentag bestimmen, macht man das mit folgender Formel:

 

Die Formel setzt sich aus vier verschiedenen mathematischen Ausdrücken zusammen, welche dann addiert werden.

 

Das sind die Fake News, welche in dieser Stunde zusätzlich bei den Personen laden und in der nächsten Stunde weitergeleitet werden können.

 

Dieser Teil der Formel berücksichtigt die Fake News, welche vor einer Stunde in das Netzwerk gelangt sind. Deshalb werden sie zum jetzigen Zeitpunkt mit der ersten Matrix multipliziert.

 

Hier werden die Fake News betrachtet, welche vor zwei Stunden bei den Personen ankamen. Diese wurden nach einer vergangenen Stunde mit der ersten Matrix zu der passenden Uhrzeit multipliziert und dann nach einer weiteren Stunde mit der zweiten Matrix zum jetzigen Zeitpunkt.

 

 

In diesem Teil werden die Fake News betrachtet, welche vor 3 Stunden in das Netzwerk gelangt sind. Diese wurden nach einer weiteren Stunde mit der passenden Variante der ersten Matrix multipliziert. Nach insgesamt zwei Stunden wurde dann mit der zweiten Matrix zu der richtigen Uhrzeit multipliziert. Nach drei Stunden wird dann alles mit der dritten Matrix zu der jetzigen Uhrzeit multipliziert.

Anders als bei der vorhergehenden Modellierung berechnen wir die Anzahl der Fake News, welche bei den 20 Personen vorliegen nicht schrittweise. Das dient der besseren Übersichtlichkeit.

Bildet man anschließend die Summe der Einträge des Vektors, erhält man dann die Gesamtanzahl der Fake News im Netzwerk an einem Wochentag zu einer bestimmten Uhrzeit.

Möchte man nun die Anzahl der Fake News am Donnerstag um 17 Uhr herausfinden, führt man folgende Rechnung durch:

 

Aufklärung

Bearbeiten

Die Verbreitung der Fake News unter dem Parameter der Aufklärung erfolgt ähnlich wie im zweiten Zyklus. Die Modellierung erfolgt auch hier stundenweisen. Es entstehen neue Matrizen, indem unsere Aufklärungsmatrix 1,2 und 3 mit den jeweiligen Uhrzeiten für Montag bis Donnerstag, für Freitag, und für Sonntag multipliziert werden. Dabei geben die Uhrzeiten die Aktivität am Handy zu einer bestimmten Uhrzeit an und unsere Aufklärungsmatrix den Anteil der Nachrichten, die die Person an eine andere weiterleiten würde.

Die Modellierung zeigt nun die Verbreitung der Fake News unter Berücksichtigung der Uhrzeit und des Wochentags. Möchte man den Vektor, welcher die Anzahl der Fake News angibt für eine bestimmte Uhrzeit zu einem bestimmten Tag bestimmen, geht man wie folgt vor:

 

Die Formel setzt sich folgendermaßen zusammen:

 

Das sind neue Fake News, welche stündlich dazu kommen und weitergeleitet werden können.

 

Das sind die Fake News unter Berücksichtigung der Fake News, welche vor einer Stunde in das Netzwerk kamen, weshalb sie mit der Aufklärungsmatrix 1 multipliziert werden.

 

Hier werden die Fake News betrachtet, welche vor zwei Stunden in das Netzwerk gelangt sind. Diese wurden nach der ersten Stunde mit der Aufklärungsmatrix 1 zur passenden Uhrzeit multipliziert und werden dann nach einer weiteren Stunde mit der Aufklärungsmatrix 2 zur aktuellen Uhrzeit multipliziert.

 

 

Dieser Teil stellt die Fake News dar, welche vor drei Stunden in das Netzwerk gelangt sind. Nach der ersten Stunde wurden diese mit der Aufklärungsmatrix 1 zur passenden Uhrzeit multipliziert, dann in Stunde 2 mit der Aufklärungsmatrix 2 zur passenden Uhrzeit und anschließend nach drei Stunden wird mit der Aufklärungsmatrix 3 zur aktuellen Uhrzeit multipliziert.

Anschließend wurde dann noch die gerundete Summe der Einträge der Vektoren berechnet, welche die Anzahl der Fake News zu einer bestimmten Uhrzeit angibt. Möchte man die Anzahl der Fake News am Donnerstag um 8 Uhr herausfinden, führt man folgende Berechnung durch:

 

Löschen

Bearbeiten
 

Auch in diesem Zyklus soll, wie im Zyklus 2, die Veränderung der Verbreitung der Fake News im Hinblick auf Löschen der im Netzwerk kursierenden falschen Nachrichten betrachtet werden. Dabei wollen wir wieder deutlich machen, wie sich die Verbreitung der Fake News alleine durch Löschen von 25% der Falschmeldungen auswirkt. Unser Vorgehen ist vergleichbar mit dem Vorgang bei der Verbreitung der Fake News, allerdings wurde hier die komplette Rechnung mit 0,75 multipliziert.

 

Abschließend bildet man die Summe der Einträge des Vektors und erhält dann so die Gesamtanzahl der Fake News nach einem Löschvorgang im Netzwerk an einem Wochentag zu einer bestimmten Uhrzeit.

Möchte man nun die Anzahl der Fake News am Donnerstag um 17 Uhr herausfinden, führt man folgende Rechnung durch:

 

Aufklärung und Löschen

Bearbeiten
 

Zum Schluss unserer Modellierung möchten wir, wie auch in unserem Zyklus 2, auch noch die Veränderung der Verbreitung der Fake News mit Blick auf einen Löschvorgang und einer Aufklärung der Personen betrachten. Dabei wollen wir deutlich machen, wie sich die Fake News durch Löschen von 25% der Falschmeldungen und einer Aufklärung der Personengruppe mithilfe des Aufklärungsvektors auswirkt.

 

Abschließend bildet man die Summe der Einträge des Vektors und erhält dann so die Gesamtanzahl der Fake News nach einem Löschvorgang und einer Aufklärung der Personen im Netzwerk an einem Wochentag zu einer bestimmten Uhrzeit.

Möchte man nun die Anzahl der Fake News am Donnerstag um 17 Uhr herausfinden, führt man folgende Rechnung durch:

 

Auswertung

Bearbeiten
 

Man erkennt an alle Verläufen die Auswirkung der Tageszeiten. Die Anzahl der Fake News im Netzwerk sind nachts niedrig und konstant. Tagsüber ist die Anzahl der Fake News immer morgens, mittags und abends besonders hoch im Gegensatz zu den anderen Tageszeiten. Grün beschreibt die normale Verteilung der Fake News. Im Vergleich dazu liegen die Modellierungen mit einer Intervention unterhalb des grünen Graphen. Betrachtet man die Aufklärung und das Löschen, kann man erkennen, dass die Aufklärung der Verbreitung der Fake News mehr entgegenwirken kann als das Löschen. Die Kombination aus Aufklärung und Löschen stellt nochmals eine Verbresserung gegen über der Modellierung mit der Aufklärung. Also ist sowohl das Löschen als auch das Aufklären hilfreich bei der Eindämmung der Verbreitung der Fake News. Die Kombination beider erreicht die beste Intervention. Allerdings ist die Aufklärung der universalere Weg um gegen die Verbreitung der Fake News vorzugehen.

Probleme der Modellierung

Bearbeiten

Auch bei dieser Modellierung betrachten wir wieder die Weiterleitungen von Fake News in einem stündlichen Takt. Das Problem, dass hier besteht, ist, dass davon ausgegangen wird, dass die Personen pro Stunde einmal ihre einkommenden Nachrichten anschauen und diese einmal in der Stunde diese eventuell weiterleiten. Jedoch kann es durchaus der Fall sein, dass Personen öfter als nur einmal in der Stunde Nachrichten lesen und weiterleiten. Und diese Anzahl kann sich von Person zu Person variieren. Das müsste beachtet werden um noch ein realistischeres Ergebnis erhalten zu können.


Zudem haben wir in dieser Modellierung eine "Verschlechterung" zur zweiten Modellierung vornehmen. Bei dieser Modellierung haben wir nur einen Vektor, welcher die neuen Fake News pro Stunde beschreibt. Im Gegensatz dazu haben wir davor jede Stunde einen neuen Vektor für die dazukommenden Fake News generiert. Das haben wir bei dieser Modellierung auf Grund der Übersichtlichkeit unseres erstellten Dokuments in Maxima geändert. Allerdings ist es in der Realität nicht so, dass stündlich immer die selbe Anzahl der Nachrichten an die Personen gelangen.


Durch die erstellten Funktionen haben wir einen allgemeinen Tagesablauf für alle Wochentage für die Personen unseres Netzwerks erstellt. Allerdings kann man nicht davon ausgehen, dass jede Person ungefähr diesen Tagesablauf befolgt. Es wäre zum Beispiel denkbar, dass Personen ganz andere Arbeitszeiten haben. Das könnte zum Beispiel bei Schichtarbeit der Fall sein. Dieses Problem hat durchaus seine Berechtigung und könnte durch weitere Verfeinerungen behoben werden, allerdings ist die allgemeine Modellierung des Tagesablaufs trotzdem eine gute Annahme. Jedoch geht des Weiteren mit der erstellten Funktion einher, dass die Annahme getätigt wird, dass jede Person das selbe Niveau hinsichtlich der Aktivität am Handy aufweist. Das Niveau der Aktivität am Handy ist jedoch von Person zu Person unterschiedlich. Betrachtet man die Graphen der Funktionen kann man an einigen Stellen große Ausreißer nach oben bei den y-Werten beobachten. Das führt dazu, dass es zu vereinzelten sehr hohen Zahlen bei den sich im Umlauf befindenden Fake News kommt. Das führt zur Verfälschung der Auswertung, weshalb diese einzelnen Werte in der Auswertungsphase isoliert wurden, so dass ein aussagekräftiges Ergebnis zustande kommt.


In der Nacht wird für ein paar Stunden von keinerlei Aktivität am Handy ausgegangen. Das führt dazu, dass die einkommenden Nachrichten nicht gelesen und auch nicht weitergeleitet werden. Zusätzlich wird aber davon ausgegangen, dass nach drei Stunden die Nachrichten wieder aus dem Netzwerk verschwinden. In der Realität liest man jedoch die Nachrichten, welche man nachts erhalten hat, einfach am nächsten Morgen. Das wird in der Modellierung nicht beachtet.

In dieser Modellierung haben wir versucht das Problem anzugehen, dass nicht in jeder Stunde die selbe Matrix für die Weiterleitungen verwendet werden kann. Die anderen Probleme der zweiten Modellierung bleiben jedoch bei dieser trotzdem noch vorhanden.

Software

Bearbeiten
  • wxMaxima
  • LibreOffice Calc

Mathematische Theorie für die Modellierungszyklen

Bearbeiten

Zyklus 1: Sekundarstufe I

Bearbeiten

Grundlagen einer Exponentialfunktion

Bearbeiten

Eine Exponentialfunktion beschreibt, wie der Name schon sagt, ein exponentielles Wachstum. Das Wachstum steigt sehr viel schneller an als bei einer linearen Funktion. Die Funktion ist also streng monoton steigend. Eine allgemeine Formel einer Exponentialfunktion lautet wie folgt:

 

Das x steht in dieser Formel immer im Exponenten. Der Parameter a gibt den Anfangswert an und die Basis b gibt an, wie steil bzw. flach die Kurve verläuft. Der Anfangswert a kann jeden beliebigen Wert außer 0 annehmen, allerdings muss die Basis b größer sein als 0.

Jede Exponentialfunktion hat als Asymptote die x-Achse. Eine Asymptote ist eine Gerade, woran sich die Kurve der Funktion annähert. Der Abstand der Kurve und der Asymptote wird im Unendlichen sehr klein. DIe Funktion geht immer durch den Punkt (a|0), da  .

  •   für b=1:

Ist  , so erhält man eine waagerechte Gerade durch Punkt a.

  •   für 0<b<1:

Ist b Element von [0,1], so fällt die Exponentialfunktion. Sie ist also streng monoton fallend. Man kann also sagen: Je kleiner b ist, desto schneller fällt die Kurve.

  •   für a>0:

Der Anfangswert a kann unabhängig von der Basis b bestimmt werden. Ist a>0, so ist a der y-Achsenabschnitt.

  •   für a<0:

Ist a<0, so ist a auch der y-Achsenabschnitt, jedoch wird die Kurve zusätzlich noch an der x-Achse gespiegelt.

  •  :

Mithilfe des Parameters d wird die Funktion auf der y-Achse genau um d verschoben.

Rechnen mit Exponentialfunktionen

Bearbeiten
  • Addition der Exponenten:

 

  • Multiplikation der Exponenten:

 

  • Subtraktion der Exponenten:

  für c>x

Summenzeichen

Bearbeiten

Das Summenzeichen hilft bei einer Addition von mehreren Zahlen.   (Sigma) ist ein griechischer Buchstabe und gleichzeitig das Summenzeichen. Das Summenzeichen hat mehrere Bauteile.

  • der Laufindex k: Variable, über die die Summe läuft
  • der Startwert i: kleinster Wert des Laufindex k, die untere Grenze
  • der Endwert n: größter Wert des Laufindex k, die obere Grenze

 

Sprich: Die Summe über   von k=i bis n.

Die Summe wird dann berechnet, indem nacheinander alle Werte vom Startwert bis zum Endwert eingesetzt werden.

Zyklus 2: Sekundarstufe II

Bearbeiten

Aufbau von Matrizen und Vektoren

Bearbeiten
  • Matrizen

Eine Matrix ist eine rechteckige, geordnete Zusammenfassung von reellen Zahlen. Die einzelnen Elemente einer Matrix bezeichnen wir als Koeffizienten. Um eine m x n Matrix zu bilden, brauchen wir m Zeilen und n Spalten. Jede Spalte hat m Zeileneinträge und jede Zeile hat n Spalteneinträge, welche variieren können. Eine m x n Matrix hat die Dimension m x n. Es gibt besondere Arten von Matrizen. Eine davon ist eine Quadratische Matrix, bei dieser ist m=n. Bei einer Nullmatrix sind alle Koeffizienten 0.

  

  • Vektoren

Ein Vektor ist eine geordnete Zusammenfassung von reellen Zahlen. Die einzelnen Elemente eines Vektors heißen Komponenten. Ein Vektor besteht aus nur einer Spalten und m Zeilen. Hat ein Vektor m Komponenten, wird er als m-dimensionaler Vektor bezeichnet. Wie bei den Matrizen gibt es auch bei den Vektoren besondere Arten. Eine davon ist der Nullvektor, bei diesem sind alle Komponenten 0. Ein Vektor ist ein Spezialfall von einer Matrix.

  

  • Multiplikation von Vektoren mit einem Skalar

Wollen wir einen Vektor mit einem Skalar multiplizieren, müssen wir jede Komponente des Vektors mit dem Skalar multiplizieren.

  

Rechnen mit Matrizen

Bearbeiten
  • Skalar mal Matrix

Wenn wir eine Matrix A mit einem Skalar \lambda multiplizieren wollen, müssen wir jedes Element von A mit r multiplizieren.

  

  • Matrix mal Vektor

Wollen wir eine Matrix A mit einem Vektor x multiplizieren, müssen wir zuerst überprüfen, ob die Spaltenzahl der Matrix mit der Zahl der Komponenten des Vektors übereinstimmt. Ist dies der Fall, können wir diese Multiplikation wie folgt durchführen. Wir betrachten nun die erste Zeile von Matrix A. Es werden die einzelnen Einträge dieser Zeile mit den jeweils entsprechenden Einträgen des Vektors multipliziert. Danach summieren wir die Ergebnisse der Multiplikationen und erhalten so die erste Komponente des Vektors.

  

Für das zweite Element des Ergebnisvektors betrachten wir die zweite Zeile von Matrix A und berechnen die zweite Komponente analog.

 

Dies wird so oft wiederholt, bis alle Spalten mit den entsprechenden Komponenten multipliziert worden sind und einen Ergebnisvektor erhalten.

 

  • Matrix mal Matrix

Wollen wir eine Matrix A mit einer Matrix B multiplizieren, müssen wir zuerst überprüfen, ob die Spaltenzahl der Matrix A mit der Zeilenzahl Matrix B übereinstimmt. Ist dies der Fall, können wir diese Multiplikation wie folgt durchführen. Wir betrachten nun die erste Zeile von Matrix A. Es werden die einzelnen Einträge dieser Zeile mit den jeweils entsprechenden Spalteneinträgen der Matrix B multipliziert. Danach summieren wir die Ergebnisse der Multiplikationen und erhalten so den ersten Koeffizienten.

  

Für den nächsten Koeffizienten der Ergebnismatrix in der ersten Zeile und zweiten Spalte multiplizieren wir entsprechend die erste Zeile von A und die zweite Spalte von B und bilden die Summe der Multiplikationen.

 

Dieses Rechenschema setzt sich nun für die weiteren Koeffizienten der ersten Zeile fort.

 

Dies wird für jede weitere Zeile wiederholt bis das Matrizenprodukt A*B die Ergebnismatrix ergibt.

 

siehe Zyklus 1

Zyklus 3: Uni-Niveau

Bearbeiten
  • Lagrange Interpolation:

Bei der Interpolation sind verschiedene Stützpunkte xi, y i i = 1,...,n gegeben. Die Interpolation soll eine geeignete Kurve zeigen, damit beliebige Funktionswerte zwischen der kleinsten und größten Stützstelle x0 und xn bestimmt werden können. Es gibt die Lagrange-Interpolation und die Newton-Interpolation. Diese zwei verschiedenen Interpolationen unterscheiden sich in ihrem Rechenweg. Die Newton-Interpolation wird schrittweise durchgeführt und ist deshalb für unsere Modellierung zu aufwendig. Die Lagrange-Interpolation hingegen wird durch die Berechnung eines langen Polynoms, das sogenannte Interpolationspolynom, durchgeführt. Die Koeffizienten können also direkt aus den Stützstellen berechnet werden. Das Interpolationspolynom besteht aus der Summe der einzelnen Langrangepolynomen.

Formel für das Lagrangepolynom:

  ,

Formel für das Interpolationspolynom:

  ,

  • Matrixmultiplikationen:

siehe Zyklus 2

  • Summe:

siehe Zyklus 1

Quellen/Literatur

Bearbeiten