Kurs:Mathematische Modellbildung/Themen/Sprache und Semantische Netze/Einführung Thema

Einleitung Bearbeiten

  • Ziel: Erstellung eines Epochenschlüssels zur Einordnung unbekannter/undatierter Gedichte
  • untersuchte Textart: Gedichte (bieten sich für eine Untersuchung am besten an, da sie häufig einem schematischen Aufbau folgen und es distinktive Merkmale gibt im Gegensatz zu anderen Gattungen wie Epos oder Dramen)
  • Epochen: Renaissance, Romantik, Moderne
  • untersuchte Merkmale: Versanzahl, Reimschema, Metrum

Theorie zur Bestimmung der Rohdaten Bearbeiten

Epochen Bearbeiten

  • Renaissance:1500-1649
  • Romantik: 1780-1837
  • Moderne: 1914-1945

Metrum Bearbeiten

(unbetont: x, betont: /)

  • Jambus: x/
  • Trochäus: /x
  • Daktylus: /xx
  • Anapäst: xx/

Reimschemata Bearbeiten

  • Paarreim: aabb
  • Kreuzreim: abab
  • umarmender Reim: abba
  • verschränkender Reim: abc abc

Tabellarische Darstellung der Rohdaten am Beispiel Renaissance Bearbeiten

 

Mathematische Aspekte Bearbeiten

Problemstellung der Modellierung Bearbeiten

  • Besteht die Möglichkeit undatierte Gedichte anhand eines von uns definierten Epochenschlüssels einer Epoche zuordnen zu können ?

Mathematische Grundlagen/Theorien zur Berechnung Bearbeiten

Sekundarstufe I: Bearbeiten

  • Satz des Pythagoras
  • Tabellenkalkulation, Daten in Excel eintragen
  • Anteil verschiedener Merkmale der Gedichte als Bruch ausdrücken
  • Brüche in Prozentschreibweise umwandeln
  • Berechnung arithmetisches Mittel

Sekundarstufe II: Bearbeiten

  • Eintragen von Punkten und Vektoren im Koordinatensystem des ℝ3
  • Bestimmen/Berechnen von Punkten im ℝ3
  • Abstandsberechnung von Punkten im ℝ3
  • Vektorrechnung im ℝ3 (Bestimmen von Längen)
  • Einsatz von GeoGebra
  • Kugelgleichung im ℝ3
  • Normen, Metrik, Topologie

Universität: Bearbeiten

Programme zur Berechnung Bearbeiten

  • Sek I: GeoGebra, Tabellenkalkulation
  • Sek II: GeoGebra
  • Universität: wxMaxima, Tabellenkalkulation

Durchführung Modellierungszyklus 1 Bearbeiten

Ziel Bearbeiten

  • Bestimmen von Kugeln im ℝ3 (=Epochen), um Gedichte (dargestellt als Punkte im ℝ3) mit Berechnung des Abstands zur Kugel zu Epochen zuordnen zu können
  • Annahme: Gedichte gehören zu der Epoche, zu der sie den geringsten Abstand aufweisen.

Modellierung Bearbeiten

Erhebung der Daten Bearbeiten

  • durch eigene Analyse von Gedichten (je 5 Trainingsgedichte, 3 Testgedichte pro Epoche)
  • Eintragen der Daten in Tabellenkalkulationsprogramm
  • Bestimmen des arithmetischen Mittels für jedes untersuchte Merkmal

Bestimmung der Punkte der Gedichte und Epochen im ℝ3 Bearbeiten

 
Punkte Trainingsgedichte Renaissance (GeoGebra)
  • Beschränkung auf x: Jambus, y: Trochäus, z: Verszahl der Gedichte aus Daten
  • Verwendung von x,y,z als Koordinaten der Punkte der Gedichte
  • Epochen dargestellt durch Durchschnittswerte für x,y,z

Bestimmung Kugelgleichung anhand der Trainingsgedichte Bearbeiten

  • Durchschnittswerte der Epoche für x,y,z als Mittelpunkt der Kugel
  • Radius: größter Abstand eines zugehörigen Trainingsgedichts zur Epoche
Bestimmung Abstände Trainingsgedichte zu Mittelpunkt 1 Bearbeiten
 
Quader um die Punkte Renaissance und Donne (GeoGebra)
  • größter Abstand = Radius Kugel
  • Erstellen Quader um den Mittelpunkt und Punkt eines Trainingsgedichts (Seiten parallel zu Ebenen definiert durch Achsen)
  • Raumdiagonale Quader entspricht Abstand der Punkte
Bestimmung Abstände Trainingsgedichte zu Mittelpunkt 2 Bearbeiten
  • mithilfe Satz des Pythagoras kann Länge Raumdiagonale bestimmt werden
 
Abbildung des Satz des Pythagoras zur Bestimmung des Abstandes der Punkte Renaissance und Donne (GeoGebra)
  • Erstellen der Formel für weitere Berechnungen:
 
 
  • Berechnungen können mithilfe von GeoGebra überprüft werden
Bestimmung der Kugelgleichung Bearbeiten
 
Kugeln aller Epochen und alle Testgedichte
  • aus Durchschnittspunkt der Epoche (=Kugelmittelpunkt) und größtem Abstand Trainingsgedicht zu Durchschnittspunkt Epoche (=Radius)
  • Einsetzen der Werte in Koordinatenform:  
  • Darstellung mit GeoGebra

Test des Modells mithilfe der Testgedichte Bearbeiten

  • Überprüfung Güte des Modells
  • Überprüfung, ob Testgedichte zur passenden Epoche zugeteilt werden durch Berechnung des Abstands zu allen Kugelmittelpunkten
  • Berechnung durch Bestimmung Länge Verbindungsvektor (Überprüfung mit GeoGebra)
  • Zuordnung zu Epoche in Tabellenkalkulation dargestellt (=WENN(UND(C4<D4;C4<E4);"Renaissance"; WENN(UND(D4<C4;D4<E4);"Romantik";"Moderne")))
  • Ausgabe richtige oder falsche Zuordnung in Tabellenkalkulation (=WENN(F4="Renaissance";"ja";"nein"))

Bewertung und Optimierung Modellierungszyklus 1 Bearbeiten

  • nur 4 von 9 Testgedichten richtig zugeordnet
  • Optimierungsvorschläge:
  • mehr Merkmale beachten
  • mehr Daten (Trainings- und Testgedichte)
  • prozentuale Zuordnung und nicht "1:1"-Zuordnung bestimmen

Durchführung Modellierungszyklus 2 Bearbeiten

Ziel Bearbeiten

  • Finden einer Funktion f zur prozentualen Zuordnung der Gedichte zu den Epochen
  • Berechnung Fehler der Funktion f
  • Bestimmen Fehlerfunktion E zur Funktion f
  • Minimieren des Fehlers mithilfe des Gradientenabstiegsverfahrens/ Optimierung der Funktion f

Modellierung Bearbeiten

Aufstellen der Funktion f 1 Bearbeiten

  • gibt prozentuale Zuordnung der Gedichte zu den 3 Epochen aus
  • mögliche Werte müssen im Intervall   liegen
  • "perfekte" Zuordnung hat Wert 1, keine Übereinstimmung bei Wert 0
  • Form f: Spaltenvektor mit der Zuordnung  
  • Berechnung der Funktionswerte mit WxMaxima

Aufstellen der Funktion f 2 Bearbeiten

 
Funktion f Zuordnung Gedichte zu Epochen

Berechnung des Fehlers von f Bearbeiten

  • Bestimmen der Güte der Funktion
  •  
  • Vergleich der Länge der Vektoren der Funktionswerte und der tatsächlichen Zuordnungen
  • Quadrieren: positive Ergebnisse, Differenzierbarkeit
  •  
  • Gesamtfehler der Funktion durch Bildung der Summe aller Fehler der Trainingsgedichte

Aufstellen der Fehlerfunktion E Bearbeiten

 
Fehlerfunktion E
  • Ersetzen der Daten der Mittelpunkte der Kugeln durch Variablen
  • später: Optimierung der Kugelmittelpunkte und Minimierung Fehler

Gradientenabstiegsverfahren Bearbeiten

  • Iteratives Verfahren
  • Optimierung der Fehlerfunktion (Finden des Minimums von E)
  • Verschiebung Kugelmittelpunkte
  • Verringerung Fehler
  • Verwenden des negativen Gradienten (Richtung stärkster Abstieg) zum Finden des Minimums der Funktion
  • Abbruchkriterium: Gradient wird 0
  • in unserem Fall: Wert Optimierung = 0
Bestimmen Gradient Bearbeiten
  • Bestimmen partielle Ableitungen der Fehlerfunktion E
  •  
  • Verwendung WxMaxima
Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 1 Bearbeiten
  • 18 Iterationsschritte -> zeitliche Begrenzung
  • Eingabe Startwerte (Mittelpunkte der Kugeln, Schrittweite 1)
  • Veränderung der Variablen (Mittelpunkte der Kugeln) (durch Tabellenkalkulation =WENN($ AE3<$ AD3;A3+T3;A3))
 
Gradientenabstiegsverfahren: Variablen
Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 2 Bearbeiten
  • falls optimierter Funktionswert von E kleiner als vorheriger Funktionswert: Addition des Schritts zur Variable
  • Eintragen Wert partieller Ableitungen (berechnet mit WxMaxima als Summe aller Werte der partiellen Ableitungen der einzelnen Trainingsgedichte)
  • Schrittweite α als 1 festlegen: bei fehlender Optimierung des Funktionswertes von E wird diese halbiert (durch Tabellenkalkulation =WENN(AE3>AD3;S3/2;S3))
 
Gradientenabstiegsverfahren: partielle Ableitungen, Schrittweite
Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 3 Bearbeiten
  • Berechnung Schritt der Variablen: negativer Wert normierter Gradient (Division durch seine Vektorlänge) wird mit Schrittweite multipliziert (durch Tabellenkalkulation =-J3*S3/AC3)
 
Gradientenabstiegsverfahren: Schritte, Vektorlänge
  • Berechnung Vektorlänge Gradient zur Normierung des Gradienten durch euklidische Norm des Gradientenvektors (durch Tabellenkalkulation =WURZEL(J3^2+K3^2+L3^2+M3^2+ N3^2+O3^2+P3^2+Q3^2+R3^2))
Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 4 Bearbeiten
  • Berechnung Funktionswert der Fehlerfunktion E vor der Optimierung des Iterationsschritts (durch WxMaxima)
  • Berechnung Funktionswert der Fehlerfunktion E nach Optimierung durch Addition Schritt zur Variable (durch WxMaxima)
  • Bestimmung der Optimierung: Subtraktion neuer von altem Funktionswert (durch Tabellenkalkulation =AD3-AE3)
 
Gradientenabstiegsverfahren Optimierung

Bestimmen der verbesserten Funktion f und der Funktionswerte und Fehler Bearbeiten

  • Einsetzen der neu berechneten Punkte in die Funktion f
  • mit neuer Funktion Funktionswerte Trainingsgedichte berechnen
  • Fehler der Trainingsgedichte mit neuen Kugelmittelpunkten bestimmen

Bestimmen der Zuordnung der Testgedichte anhand der verbesserten Funktion f Bearbeiten

  • Bestimmen der Funktionswerte der verbesserten Funktion f mit den Werten der Testgedichte
  • in WxMaxima
  • Eingabe in Tabellenkalkulation, Zuordnung automatisch ausgegeben
=WENN(UND(C4>D4;C4>E4);"Renaissance"; WENN(UND(D4>C4;D4>E4);"Romantik";"Moderne"))
  • automatische Ausgabe in Tabellenkalkulation, ob richtig zugeordnet
=WENN(F5="Renaissance";"ja";"nein")

Bewertung und Optimierung Modellierungszyklus 2 Bearbeiten

  • Funktion zur prozentualen Zuordnung erstellt
  • Fehler konnte verringert werden
  • verbesserte Funktion erstellt
  • mehr Iterationsschritte möglich
  • Automatisierung Gradientenabstiegsverfahren
  • geringe Anzahl an verwendeten Merkmalen
  • wenige Daten verwendet

Seiteninformation Bearbeiten

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Mathematische Modellbildung' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.