In der Statistik ist ein gleitender Mittelwert eine Berechnung zur Analyse von Datenpunkten durch Erstellen einer Reihe von Mittelwerten aus verschiedenen Teilmengen des vollständigen Datensatzes. Es wird auch als 'Moving Average (MA)'[1] oder rolling mean und ist eine Art Limited Impulse Response Filter. Zu den Variationen gehören: einfach, und kumulativ, oder gewichtet Formen (siehe unten).

Ein Beispiel für zwei gleitende Durchschnittskurven
Gleitender Mittelwert von einem mit einer Sinusfunktion überlagerten quadratischem Polynom - Visualisierung zeigt den Grad der Glättung der Originalfunktion in blau mit unterschiedlichen Intervallbreiten bei der Integration
Moving average sine and polynom - visualization of the smoothing with a larger interval for integration
Animation showing the impact of interval width and smoothing by moving average.

Zwei Teile der Begriffe "Moving" und "Average" mussten mathematisch definiert werden:

  • Gleiten als additive Operation in Vektorraum(kontinuierlich) oder additive Gruppe. (diskret). Es beinhaltet, eine Referenzposition im sich bewegenden Raum zu haben.
  • Durchschnitt, indem ein Mittelwert für eine Teilmenge der gesammelten Daten entsprechend der Referenzposition im Raum gebildet wird (verallgemeinert Erwartungswert für die Referenzposition).

Bei einer Reihe von Zahlen und einer festen Größe der Teilmenge wird das erste Element des gleitenden Mittelwerts erhalten, indem der Mittelwert der anfänglichen festen Teilmenge der Zahlenreihe gebildet wird. Dann wird die Teilmenge durch "Vorwärtsschalten" modifiziert, d.h. ohne die erste Zahl der Serie und mit dem nächsten Wert in der Teilmenge.

Ein gleitender Durchschnitt wird häufig zusammen mit den Daten dertime series verwendet, um kurzfristige Schwankungen auszugleichen und längerfristige Trends oder Zyklen aufzuzeigen. Der Schwellenwert zwischen kurz- und langfristig hängt von der Anwendung ab, und die Parameter des gleitenden Durchschnitts werden entsprechend eingestellt. Beispielsweise wird es häufig in technical analysis von Finanzdaten wie Aktienprices,returns oder Handelsvolumen verwendet. Es wird auch in economics verwendet, um Bruttoinlandsprodukt, Beschäftigung oder andere makroökonomische Zeitreihen zu untersuchen. Mathematisch gesehen ist ein gleitender Mittelwert eine Art von convolution] und kann daher als Beispiel für einenTiefpassfilter betrachtet werden, der in signal processing verwendet wird. Bei Verwendung mit Nicht-Zeitreihen-Daten filtert ein gleitender Mittelwert höherfrequente Komponenten ohne spezifischen Zeitbezug, obwohl typischerweise eine Art von Ordnung impliziert ist. Vereinfacht betrachtet kann es als Glättung der Daten angesehen werden.

Generischer Ansatz für einen gleitenden Mittwert

Bearbeiten

Ein Element bewegt sich in einem additiven Gruppe oder Vektorraum V'. In einem generischen Ansatz haben wir eine bewegliche Wahrescheinlickeitsverteilung. definiert, wie sich die Werte in der Umgebung von auf den gleitenden Durchschnitt auswirken.

Diskretes/stetiges gleitendes Mittel

Bearbeiten

Anhand von Wahrscheinlichkeitsverteilungen müssen wir zwischen einer

  • diskret (Wahrscheinlichkeitsmassenfunktion ) und
  • stetig' (Wahrscheinlichkeitsdichtefunktion )

eines gleitenden Mittels unterscheiden. Die Terminologie bezieht sich auf Wahrscheinlichkeitsverteilungen und die Semantik der Wahrscheinlichkeitsmasse/Dichtefunktion beschreibt die Verteilung der Wahrscheinlichkeit auf eine Umgebung um den Wert . Im diskreten Fall bedeutet die , dass einen Einfluss von 20% auf den gleitenden Mittelwert für die Berechnung von in der Umgebung von hat.

Animation - stetiges gleitendes Mittel

Bearbeiten

Stetiger gleitender Mittelwert - animiert

Veschiebung der Wahrscheinlickeitsverteilung auf dem Grundraum

Bearbeiten

Wenn die Wahrscheinlichkeitsverteilung um in verschoben wird. Das bedeutet, dass die Wahrscheinlichkeitsmassenfunktionen bzw. die Wahrscheinlichkeitsdichtefunktionen durch eine Wahrscheinlichkeitsverteilung am Nullelement der additiven Gruppe bzw. zero vector des Vektorraums erzeugt werden. Aufgrund der Art der gesammelten Daten existiert f(x) für eine Teilmenge . In vielen Fällen sind T die Zeitpunkte, zu denen Daten erhoben werden. Die und die Verschiebung einer Verteilung wird durch die folgende Eigenschaft definiert:

  • diskret: Für alle erfüllt die Wahrscheinlichkeitsmassenfunktion für .
  • kontinuierlich:. Für alle Wahrscheinlichkeitsdichten erfüllt die Funktion .

Lernaufgaben

Bearbeiten
 
Moving Average berechnet in LibreOffice - Demo-Datei Moving_average_task1.ods für Lernressource

Diese Lernressource basiert auf dem Open Community Approach, so dass die gesamte verwendete Software Open Source und das verwendete Lernmaterial standardmäßig Creative Commons in Wikiversity lizensiert sind:

  • Zufallsdaten als Beispiel für historische Aktienkursdaten in einem Tabellenkalkulationsdokument mit Libre Office Calc] mit der Funktion Cosine und/oder Sine erzeugen.
  • Anwendung eines gleitenden Durchschnitts auf die Wikiversity-Beispieldateien für dieseLernressource auf GitHub[2]
  • Erklären Sie die Unterschiede zwischen der blauen Kurve der Rohdaten und der Anwendung des gleitenden Durchschnitts (rote Kurve).
  • Fügen Sie eine weitere Zeile im LibreOffice Dokument hinzuMoving_average_task1.ods,
    • die den gleitenden Durchschnitt der letzten 10 Werte berechnet.
    • Ändern Sie das Diagramm so, dass auch der zusätzliche gleitende Durchschnitt angezeigt wird,
    • Vergleichen Sie den gleitenden Durchschnitt der letzten 5 Werte mit dem gleitenden Durchschnitt der letzten 10 Werte im LibreOffice Diagramm.

Grundlegende Konzepte für den gleitenden Mittelwert

Bearbeiten

Ein Element   bewegt sich in einem Additiv Group (mathematics)] oderVector Space V'. In einem generischen Ansatz haben wir eine beweglicheWahrscheinlichkeitsverteilung.   definiert, wie sich die Werte im Umfeld von   auf den gleitenden Durchschnitt auswirken.

Diskreter/kontinuierlicher gleitender Mittelwert

Bearbeiten

Anhand von Wahrscheinlichkeitsverteilungen müssen wir unterscheiden zwischen einer

  • diskret (Wahrscheinlichkeitsmassenfunktion  ) und
  • kontinuierlich (Wahrscheinlichkeitsdichtefunktion  )

gleitender Durchschnitt. Die Terminologie bezieht sich auf probability distributions und die Semantik der Wahrscheinlichkeitsmasse/Dichtefunktion beschreibt die Verteilung der Gewichte um den Wert  . In der diskreten Einstellung bedeutet die  , dass   einen Einfluss von 20% auf den gleitenden Durchschnitt   für   hat.

Verschiebung von Wahrscheinlichkeitsverteilungen

Bearbeiten

Wenn die Wahrscheinlichkeitsverteilung um   in   verschoben wird. Das bedeutet, dass die Wahrscheinlichkeitsmassenfunktionen   bzw. die Wahrscheinlichkeitsdichtefunktionen   durch eine Wahrscheinlichkeitsverteilung   am Nullelement der additiven Gruppe bzw. Nullvektor des Vektorraums erzeugt werden. Aufgrund der Art der gesammelten Daten existiert   für eine Teilmenge  . In vielen Fällen sind   die Zeitpunkte, zu denen Daten erhoben werden. Die und die Verschiebung einer Verteilung wird durch die folgende Eigenschaft definiert:

  • diskret: Für alle   erfüllt die Wahrscheinlichkeitsmassenfunktion   für  .
  • stetig: Für alle Wahrscheinlichkeitsdichten erfüllt die Funktion  .

Der gleitende Durchschnitt wird definiert durch:

  • diskret: (Wahrscheinlichkeitsmassenfunktion  )
 

Anmerkung:   für eine zählbare Teilmenge von  .

  • stetig Wahrscheinlichkeitsdichtefunktion  >
 

Für die Definition von Wahrscheinlichkeitsmassenfunktionen bzw. Wahrscheinlichkeitsdichtefunktionen   ist es wichtig, dass der Träger (Maßtheorie) von   eine Teilmenge von   ist. Dadurch wird sichergestellt, dass 100% der Wahrscheinlichkeitsmasse den gesammelten Daten zugeordnet werden. Der Träger   der Verteilung ist definiert als:

 

Einfacher gleitender Mittelwert - diskret

Bearbeiten
 
Glättung einer verrauschten Sinusfunktion

In Finanzanwendungen ist ein 'einfach gleitender Durchschnitt (SMA) der ungewichtete Mittelwert der vorherigen n Daten. In Wissenschaft und Technik wird der Mittelwert jedoch normalerweise aus einer gleichen Anzahl von Daten auf beiden Seiten eines zentralen Wertes gebildet. Dadurch wird sichergestellt, dass Schwankungen des Mittelwerts mit den Schwankungen der Daten in Einklang gebracht werden und nicht zeitlich verschoben werden.

Ein Beispiel für einen einfachen, gleich gewichteten laufenden Mittelwert für eine n-Tages-Stichprobe des Schlusskurses ist der Mittelwert der vorherigen n Tagesschlusskurse.

 

und   für   mit   als additive Gruppe.

Lassen Sie   die Kosten/Preis des Produktes zur Zeit   sein. Wenn diese Preise   sind und wir wollen erstellen ein einfacher gleitender Durchschnitt am Tag   und zurückblickend auf die Zeitspanne von   Tagen, dann lautet die Formel

 

Bei der Berechnung aufeinanderfolgender Werte für andere Tage/Zeitpunkte   kommt ein neuer Wert in die Summe und ein alter Wert fällt aus, so dass in diesem einfachen Fall eine vollständige Summierung jedes Mal unnötig ist,

 
 

Der gewählte Zeitraum hängt von der Art der Bewegung der Zinsen ab, z.B. kurz-, mittel- oder langfristig. In finanzieller Hinsicht kann ein bewegliches Durchschnittsniveau interpretiert werden als support in einem fallenden Markt oder resistance in einem steigenden Markt. Wenn Sie ein Diagramm für   und Kostenfunktion   zeichnen, werden Sie feststellen, dass das Diagramm von   in der Zeit   glatter läuft.

Wenn die verwendeten Daten nicht um den Mittelwert zentriert sind, liegt ein einfacher gleitender Mittelwert um die Hälfte der Stichprobenbreite hinter dem letzten Bezugspunkt zurück. Ein SMA kann auch unverhältnismäßig stark beeinflusst werden, wenn alte Bezugspunkte ausfallen oder neue Daten hereinkommen. Ein Merkmal des SMA ist, dass, wenn die Daten eine periodische Fluktuation aufweisen, die Anwendung eines SMA dieser Periode diese Variation eliminiert (der Durchschnitt enthält immer einen vollständigen Zyklus). Aber ein vollkommen regelmäßiger Zyklus ist selten anzutreffen.[3]

Für eine Reihe von Anwendungen ist es von Vorteil, die durch die Verwendung von nur "vergangenen" Daten verursachte Verschiebung zu vermeiden. Daher kann ein zentraler gleitender Mittelwert berechnet werden, indem Daten verwendet werden, die auf beiden Seiten des Punktes in der Reihe, an dem der Mittelwert berechnet wird, gleichmäßig verteilt sind.[4] Dies erfordert die Verwendung einer ungeraden Anzahl von Bezugspunkten im Probenfenster.

 

und   für   mit   als additive Gruppe.

 

Ein großer Nachteil des SMA ist, dass er eine signifikante Menge des Signals durchlässt, die kürzer als die Fensterlänge ist. Schlimmer noch, es invertiert es tatsächlich. Dies kann zu unerwarteten Artefakten führen, wie z.B. Spitzen im geglätteten Ergebnis, die dort auftreten, wo es Täler in den Daten gab. Es führt auch dazu, dass das Ergebnis weniger glatt ist als erwartet, da einige der höheren Frequenzen nicht richtig entfernt werden.

Kumulierter gleitender Durchschnitt

Bearbeiten

Kumulativer gleitender Durchschnitt - diskret

Bearbeiten

In einem kumulativen gleitenden Durchschnitt kommen die Daten in einem geordneten Datumsstrom mit   an, und der Benutzer möchte den Durchschnitt aller Daten bis zum aktuellen Bezugspunkt   erhalten. So kann beispielsweise ein Anleger den Durchschnittspreis aller Aktientransaktionen für eine bestimmte Aktie bis zum aktuellen Zeitpunkt   wünschen. Der Ausgangspunkt der Datenerfassung ist  . Da jede neue Transaktion zustande kommt, kann der Durchschnittspreis zum Zeitpunkt der Transaktion für alle Transaktionen bis zu diesem Zeitpunkt unter Verwendung des kumulierten Durchschnitts berechnet werden, typischerweise ein gleich gewichteter average der Folge von t+1 Werten   bis zur aktuellen Zeit  :

 >

Die Brute-Force-Methode zur Berechnung wäre, alle Daten zu speichern und die Summe zu berechnen und bei jeder Ankunft eines neuen Bezugspunktes durch die Anzahl der Bezugspunkte zu dividieren. Es ist jedoch möglich, den kumulierten Mittelwert einfach als neuen Wert zu aktualisieren,   wird nach der Formel verfügbar:


 

Somit entspricht der aktuelle kumulative Durchschnitt   für einen neuen Bezugspunkt   dem vorherigen kumulativen Durchschnitt   zum Zeitpunkt t-1, mal t, plus dem neuesten Bezugspunkt, geteilt durch die Anzahl der bisher erhaltenen Punkte,  . Wenn alle Bezugspunkte ankommen ( ), dann entspricht der kumulative Durchschnitt dem endgültigen Durchschnitt. Es ist auch möglich, eine laufende Summe des Bezugspunktes sowie die Anzahl der Punkte zu speichern und die Summe durch die Anzahl der Bezugspunkte zu dividieren, um bei jeder Ankunft eines neuen Bezugspunktes den CMA zu erhalten.

Die Ableitung der kumulativen Durchschnittsformel ist einfach. Verwendung von

 

und ähnlich für   wird gesehen, dass

 

Die Lösung dieser Gleichung für   führt zu:

 

Kumulativer gleitender Mittelwert - kontinuierlich

Bearbeiten

Wenn wir eine kontinuierliche Messung von Werten betrachten, z.B. eine Kraft   zur Zeit  . Ziel ist es, die Werte   mit einem kontinuierlich aggregierten gleitendem Mittelwert zu glätten. Wir sehen eine Zeitspanne von   in der Vergangenheit. Als Wahrscheinlichkeitsverteilung verwenden wir eine gleichmäßige Verteilung (Mathematik)] für den Zeitraum  . Die Dichtefunktion ist:

 .

Anwendung auf die kumulative Definition des gleitenden Durchschnitts in der Zeit   für kontinuierliche Wahrscheinlichkeitsverteilungen, die wir erhalten:

 

Gleitender Mittelwert angewendet auf Bilder

Bearbeiten
 
Pixelization was used to anonymize this photograph


Ein gewichteter Durchschnitt ist ein Durchschnitt, der Multiplikationsfaktoren aufweist, um Daten an verschiedenen Positionen im Samplefenster unterschiedlich zu gewichten. Mathematisch ist der gleitende Mittelwert der convolution der Bezugspunkte mit einer festen Gewichtungsfunktion. Eine Anwendung erstellt eine pixelisation] aus einem digitalen Grafikbild. Für das gesamte Bild auf der rechten Seite wird die Pixelisierung für mehrere Quadrate angewendet. Alle Pixel im Quadrat werden durch den Farbmittelwert aller Pixel im Quadrat ersetzt. Weil Farben durch drei Ganzzahlen definiert sind, so dass der Farbmittelwert für diese Anwendung gerundet werden muss. Um die Farbcodierung mit Ganzzahlen zu verstehen, siehe HTML Color Picker mit der RGB-Farbcodierung. Drei Werte zwischen 0 und 255 (z.B. rgb(255, 153, 102) für hellorange) kodieren eine Farbe. Da es sich bei den HTML-Farben für Rot, Grün, Blau (RGB) um Ganzzahlen handelt, werden die realen Werte des gleitenden Durchschnitts als technische Einschränkung gerundet.

Das Bild 'I mit ' m Pixelhöhe und n Pixelbreite ist die Matrix  , wobei alle Komponenten der Matrix RGB-Tripel von ganzzahligen Werten zwischen 0 und 255 sind, d.h.  .

Ein einzelnes Pixel in Zeile r und Spalte c wird als   bezeichnet. Wenn wir definieren   dann wird die

  • Die Intensität von Rot ist  ,
  • Die Intensität von Grün ist  ,
  • Die Intensität von Rot ist  .

Wenn wir berechnen und den Durchschnitt der Farben, berechnen wir den Durchschnitt von Rot, Grün und Blau separat. Als Beispiel berechnen wir einen Durchschnitt von   Submatrix des Bildes I für die vier Pixel:

  •    
  •    

Der berechnete gleitende Durchschnitt für dieses Quadrat ist:

  • Rot:.  
  • Grün:.  
  • Blau:.  

Der berechnete gleitende Durchschnitt für die   Submatrix des Bildes I ersetzt alle Originalfarben des Quadrats. Lassen Sie   das Bild mit dem gleitenden Durchschnitt für alle   Submatrizen gelten, dann wird die ausgewählte Submatrix oben in IMA so aussehen:

  •    
  •    

Im letzten Schritt wird allen Pixeln der 2x2-quadratischen Submatrix die berechnete Durchschnittsfarbe rgb(222, 84, 39) zugewiesen.

Betrachtet man das rechte Beispielbild, so ist die Anwendung des gleitenden Mittelwertes sichtbar, da sie auf eine große Submatrix des Bildes angewendet wird.

Für die Bildverarbeitung   mit dem neutralen Element   als additive Gruppe mit Zusatz:   und   T ist die Menge aller Zeilen- und Spaltenindizes der Pixel. Das Bild wird zerlegt die Quadrate oder sogar Rechtecke  . Der gleitende Durchschnitt wird für alle Pixel im Rechteck   berechnet, ähnlich wie bei   oben erwähnt. Der berechnete gleitende Mittelwert aus dem Originalbild I wird allen Pixeln des Quadrats / Rechtecks   in IMA zugeordnet. Wenn die Breite und Höhe der Rechtecke   im Allgemeinen eine Standardgröße haben. Schließen Sie die Ränder der Bilder, die Größe dieser Rechtecke muss an die verbleibenden Pixel am rechten und unteren Rand des Bildes angepasst werden I.

Siehe auch

Bearbeiten

Literatur

Bearbeiten
  1. Hydrologic Variability of the Cosumnes River Floodplain (Booth et al..., San Francisco Estuary and Watershed Science, Volume 4, Issue 2, 2006)
  2. GitHub Sammlung von Unterstützungsdateien für Wikiversity-Lernressourcen (2019) Engelbert Niehaus - GitHub Repository: https://github.com/niebert/wikiversity_files/ - ZIP-Datei für alle Lernressourcen: https://github.com/niebert/wikiversity_files/archive/master.zip - (Zugriff auf 2019/09/24)
  3. Statistische Analyse, Ya-lun Chou, Holt International, 1975, lSBN: 0-03-089422-0, Abschnitt 17.9.
  4. Die Ableitung und Eigenschaften des einfachen zentralen gleitenden Mittelwerts sind vollständig angegeben bei Savitzky-Golay-Filter