Kurs:Stochastik/Gleitender Mittelwert

Einführung Bearbeiten

Die Abbildung zeigt ein Beispiel zweier Kurven (blaue bzw. rot), wobei die blaue Kurve den Verlauf der Rohdaten und die rote den Verlauf des gleitenden Mittelwertes.

 

Gleitender Mittelwert in der Statistik Bearbeiten

In der Statistik ist der Gleitende Mittelwert (oder auch gleitendes Mittel, gleitender Durchschnitt [1]) eine Möglichkeit zur Analyse von Daten durch das Erstellen einer Serie von Mittelwerten über verschieden große Datenintervalle der Gesamtdaten. Mögliche Variationen sind einfache, kumulative oder auch gewichtete Formen (Beschreibung siehe unten).

Begriffsklärung Bearbeiten

Mathematische Definition der beiden Teile des Begriffes "gleitender" und "Mittelwert":

  • gleitend als additive Operation in einem Vektorraum (kontinuierlich) oder einer additive Gruppe (diskret). Es gibt eine sich im Raum bewegende Referenzposition.
  • Mittelwert im Sinne von Mittelwert über Daten von Teilintervallen bezüglich eines Referenzpunktes im Raum (verallgemeinert: Erwartungswert für die Referenzposition).

Beispiel für ein Verfahren der Berechnung Bearbeiten

Mittels einer Serie von Werten und einer vordefinierten Intervallbreite wird das erste Element des gleitenden Mittelwertes berechnet, indem der Mittelwert des ersten Werteintervalls berechnet wird. Dann wird das Intervall durch "vorwärts bewegen" modifiziert, indem der erste Wert heraus genommen und der nächste Wert hinzugefügt wird.

Zeitabhängigkeit von Daten Bearbeiten

Ein gleitender Mittelwert wird häufig im Zusammenhang mit zeitabhängigen Daten genutzt, um die Auswirkungen von kurzzeitigen Fluktuationen zu verringern und Trends oder Zyklen zu betonen. Der Unterschied zwischen kurz- und langfristig hängt von der Anwendung ab und die Parameter des gleitenden Mittelwertes werden dementsprechend gewählt. Zum Beispiel wird er häufig genutzt für die technische Analyse von Finanzdaten, wie zum Beispiel Preisen, Retouren und Handelsvolumen.

Verwendung in der Wirtschaft Bearbeiten

Er wird auch in der Wirtschaft genutzt, um das Bruttoinlandsprodukt, Beschäftigungszahlen oder andere makroökonomische zeitliche Verläufe zu untersuchen.


Mathematische Bezüge Bearbeiten

Mathematisch gesehen ist ein gleitender Mittelwert eine Faltung und kann somit als ein Beispiel für einen Tiefpassfilter in der Signalverarbeitung gesehen werden. Wenn er für nicht zeitabhängige Daten verwendet wird, ist normalerweise eine andere Art der Ordnung vorhanden. Vereinfacht betrachtet kann dieses Verfahren als Glättung der Daten angesehen werden.

Allgemeiner Ansatz zum gleitenden Durchschnitt Bearbeiten

Ein Element   bewegt sich in einer additiven Gruppe oder einem Vektorraum  . Allgemein haben wir eine Wahrscheinlichkeitsverteilung  , welche den Einfluss der Werte in der Umgebung um   beschreibt.

Diskreter/Kontinuierlicher gleitender Mittelwert Bearbeiten

Wie auch bei Wahrscheinlichkeitsverteilungen müsssen wir unterscheiden zwischen einem

  • diskreten (Wahrscheinlichkeitsmassenverteilung  ) und
  • kontinuierlichen ( Wahrscheinlichkeitsdichtefunktion  )

gleitenden Mittelwert. Die Terminologie bezieht sich auf Wahrscheinlichkeitsverteilungen, und die Semantik der Wahrscheinlichkeitsmassen- / Dichtefunktion beschreibt die Verteilung der Gewichtungen um den Wert  . Konkret bedeutet das, dass   bedeutet, dass   eine zwanzigprozentige Auswirkung auf den gleitenden Mittelwert   von   hat.

Verteilungen verschieben (1) Bearbeiten

Wenn die Wahrscheinlichkeitsverteilung um   in   verschoben wird, bedeutet dies, dass die Wahrscheinlichkeitsmassenfunktionen   beziehungsweise die Wahrscheinlichkeitsdichtefunktionen   durch eine Wahrscheinlichkeitsverteilung   am Nullelement der erzeugten additiven Gruppe bzw. am Nullvektor des Vektorraums generiert werden. Aufgrund der Beschaffenheit der gesammelten Daten existiert   für eine Teilmenge  . In vielen Fällen sind   die Zeitpunkte, zu denen Daten erhoben werden.

Verteilungen verschieben (2) Bearbeiten

Dies und die Verschiebung einer Verteilung wird durch die folgende Eigenschaft definiert:

  • diskret: Für alle   ist die Wahrscheinlichkeitsmassenfunktion erfüllt   für  
  • kontinuierlich: Alle   erfüllen die Wahrscheinlichkeitsdichtenfunktion  


Der gleitende Mittelwert ist definiert durch

  • diskret: (Wahrscheinlichkeitsmassenfunktion  )
 

Verteilungen verschieben (3) Bearbeiten

Merke:   für eine abzählbare Teilmenge von  .

  • kontinuierlich (Wahrscheinlichkeitsdichtefunktion  )
 

Es ist wichtig für die Definition von Wahrscheinlichkeitsmassenfunktionen beziehungsweise Wahrscheinlichkeitsdichtefunktionen  , dass der Träger von   eine Teilmenge von   ist. Dadurch wird sichergestellt, dass den erfassten Daten 100% der Wahrscheinlichkeitsmasse zugeordnet werden. Der Träger von   ist definiert als:

 .

Einfacher gleitender Mittelwert - diskret Bearbeiten

Der Glättung einer interpolierte Datenreihe, dessen Daten einer verrauschte Sinusfunktion entsprechen.

 

Einfacher gleitender Mittelwert - diskret (1) Bearbeiten

In Finanzanwendungen ist ein einfacher gleitender Mittelwert (SMA) der ungewichtete Durchschnitt der vorherigen   Daten. In Wissenschaft und Technik wird der Mittelwert jedoch normalerweise von einer gleichen Anzahl von Daten auf beiden Seiten eines zentralen Werts genommen. Dies stellt sicher, dass die Abweichungen im Mittelwert mit den Abweichungen in den Daten übereinstimmen und nicht zeitlich verschoben werden. Ein Beispiel für einen einfachen gleichgewichteten laufenden Mittelwert für eine  -Tage-Stichprobe des Schlusskurses ist der Mittelwert der Schlusskurse der letzten   Tage.

Einfacher gleitender Mittelwert - diskret (2) Bearbeiten

 

und   für   mit   als additive Gruppe.

Sei   der Preis eines Produktes zu einem Zeitpunkt  . Wenn die Preise   sind und wir einen einfachen gleitenden Mittelwert am Tag   ermitteln wollen mit einem zeitlichen Rückblick von   Tagen, dann ist die Formel

 .

Einfacher gleitender Mittelwert - diskret (3) Bearbeiten

Die sukzessive Berechnung weiterer Werte für andere Tage   erfolgt, indem ein neuer Wert in die Summe aufgenommen wird und ein alter Wert heraus fällt, was bedeutet, dass eine vollständige Summation jedes Mal für diesen einfachen Fall unnötig ist.

 
 

Einfacher gleitender Mittelwert - diskret (4) Bearbeiten

Der gewählte Zeitraum hängt von der Art der zu beobachtenden Bewegung ab, wie kurz-, mittel- oder langfristig. In finanzieller Hinsicht kann das Niveau des gleitenden Durchschnitts als Unterstützung in einem fallenden Markt oder als Widerstand in einem steigenden Markt interpretiert werden. Wenn Sie ein Diagramm für   und die Kostenfunktion   plotten, werden Sie feststellen, dass der Graph von   in der Zeit   weicher läuft.

Einfacher gleitender Mittelwert - diskret (5) Bearbeiten

Wenn die verwendeten Daten nicht um den Mittelwert zentriert sind, bleibt ein einfacher gleitender Mittelwert um die Hälfte der Abtastbreite hinter dem letzten Bezugspunkt zurück. Ein SMA kann auch durch das Herausfallen alter Bezugspunkte oder das Eintreffen neuer Daten überproportional beeinflusst werden. Eine Besonderheit des SMA ist, dass bei periodischen Schwankungen der Daten die Anwendung eines SMA dieser Periode diese Variation auslöst (der Durchschnittswert enthält immer einen vollständiger Zyklus). Ein vollkommen regelmäßiger Zyklus ist jedoch selten anzutreffen.[2]

Einfacher gleitender Mittelwert - diskret (6) Bearbeiten

Für eine Reihe von Anwendungen ist es vorteilhaft, die Verschiebung zu vermeiden, die nur durch die Verwendung von Daten der Vergangenheit ausgelöst wird. Daher kann ein zentraler gleitender Mittelwert berechnet werden, indem Daten verwendet werden, die auf beiden Seiten des Punkts in der Reihe gleich beabstandet sind.[3] Dies erfordert die Verwendung einer ungeraden Anzahl von Bezugspunkten im Intervall.

Einfacher gleitender Mittelwert - diskret (7) Bearbeiten

 

und   für   mit   als additive Gruppe.

 

Einfacher gleitender Mittelwert - diskret (8) Bearbeiten

Ein Hauptnachteil des SMA ist, dass er einen signifikanten Betrag des Signals durchlässt, der kürzer als die Fensterlänge ist. Schlimmer noch, er kehrt es tatsächlich um. Dies kann zu unerwarteten Artefakten führen, z. B. zu Peaks im geglätteten Ergebnis, die dort erscheinen, wo die Daten Tiefstwerte aufweisen. Dies führt auch dazu, dass das Ergebnis weniger glatt ist als erwartet, da einige der höheren Frequenzen nicht ordnungsgemäß entfernt wurden.

Einfacher gleitender Mittelwert - kontinuierlich Bearbeiten

Einfacher gleitender Mittelwert - kontinuierlich (1) Bearbeiten

Man betrachte eine kontinuierliche Messung eines Wertes, z.B. eine Kraft   zum Zeitpunkt  . Ziel ist es, die Werte   mit einem kontinuierlichen einfachen gleitenden Durchschnitt zu glätten. Wir haben eine Zeitspanne von   in der Vergangenheit. Als Wahrscheinlichkeitsverteilung verwenden wir eine Gleichverteilung für das Intervall  . Die Dichtefunktion ist:

Einfacher gleitender Mittelwert - kontinuierlich (2) Bearbeiten

  und  

Durch Anwendung auf die Definition des gleitenden Durchschnitts für kontinuierliche Wahrscheinlichkeitsverteilungen erhalten wir:

 

Kumulativer gleitender Mittelwert Bearbeiten

Kumulativer gleitender Mittelwert - diskret (1) Bearbeiten

In einem kumulativen gleitenden Durchschnitt kommen die Daten in einem geordneten Datenstrom mit   an und der Benutzer möchte den Durchschnitt aller Daten bis zum aktuellen Wert (Bezugspunkt  ) erhalten. Zum Beispiel kann ein Anleger den Durchschnittspreis aller Aktiengeschäfte für eine bestimmte Aktie bis zum aktuellen Zeitpunkt   wünschen. Der Startpunkt der Datenerfassung ist  .

Kumulativer gleitender Mittelwert - diskret (2) Bearbeiten

Bei jeder neuen Transaktion kann der Durchschnittspreis zum Zeitpunkt der Transaktion für alle bis zu diesem Zeitpunkt durchgeführten Transaktionen unter Verwendung des kumulativen Durchschnitts berechnet werden, üblicherweise eines gleichgewichteten Durchschnitts von einer Folge von   Werten   bis zum aktuellen Zeitpunkt  :

 

Kumulativer gleitender Mittelwert - diskret (3) Bearbeiten

Die umständliche Methode dies zu berechnen würde darin bestehen, alle Daten zu speichern, die Summe zu berechnen und durch die Anzahl der Bezugspunkte zu dividieren, wenn ein neuer Bezugspunkt hinzu kommt. Es ist jedoch möglich, den kumulativen Mittelwert einfach als neuen Wert zu aktualisieren.   wird mit der folgenden Formel emittelt:

 

Kumulativer gleitender Mittelwert - diskret (4) Bearbeiten

Somit ist der aktuelle kumulative Durchschnitt   für einen neuen Datenpunkt   gleich dem vorherigen kumulativen Durchschnitt   zum Zeitpunkt   multipliziert mit   plus dem letzten Datenpunkt und alle geteilt durch die Anzahl der bisherigen Punkte  . Wenn alle Bezugspunkte ankommen ( ), entspricht der kumulative Durchschnitt dem endgültigen Durchschnitt. Es ist auch möglich, eine laufende Summe des Bezugspunkts sowie die Anzahl der Punkte zu speichern und die Summe durch die Anzahl der Bezugspunkte zu teilen, um den CMA jedes Mal zu erhalten, wenn ein neuer Bezugspunkt ankommt.

Kumulativer gleitender Mittelwert - diskret (5) Bearbeiten

Die Herleitung der kumulierten Durchschnittsformel ist unkompliziert. Mit

 

und in gleicher Weise für  , ist zu erkennen, dass

 
  gilt.

Durch das Umstellen der Gleichung nach   erhält man

 

Kumulativer gleitender Mittelwert - kontinuierlich (1) Bearbeiten

Wenn wir eine kontinuierliche Messung von Werten, zum Beispiel einer Kraft   zum Zeitpunkt   annehmen, ist das Ziel die Glättung dieser Werte   mit einem kontinuierlichen aggregierenden gleitenden Mittelwert. Betrachtet werde eine Zeitspanne   in der Vergangenheit. Als Wahrscheinlichkeitsverteilung nutzen wir eine gleichmäßige Verteilung auf dem Intervall  . Die Dichtefunktion lautet

 

Kumulativer gleitender Mittelwert - kontinuierlich (2) Bearbeiten

Durch Anwendung auf die Definition des kumulativen gleitenden Mittelwertes für kontinuierliche Wahrscheinlichkeitsverteilungen erhalten wir

 

Gleitender Mittelwert für Bilder Bearbeiten

 
Hier wurde Pixelisierung genutzt, um die Person unkenntlich zu machen.

Gleitender Mittelwert für Bilder (1) Bearbeiten

Ein gewichteter Durchschnitt ist ein Durchschnitt, der Multiplikationsfaktoren aufweist, um Daten an verschiedenen Positionen im Abtastfenster unterschiedlich zu gewichten. Mathematisch ist der gleitende Durchschnitt die Faltung der Bezugspunkte mit einer festen Gewichtungsfunktion. Eine Anwendung stellt eine Pixelisierung aus einem digitalen Grafikbild dar. Für alle Bilder wird die Pixelisierung für mehrere Quadrate angewendet. Alle Pixel im Quadrat werden durch den Farbmittelwert jener ersetzt. Da Farben durch drei ganzzahlige Zahlen definiert werden, muss der Farbmittelwert für diese Anwendung gerundet werden.

Gleitender Mittelwert für Bilder (2) Bearbeiten

Zum Verständnis der Farbkodierung mit ganzzahligen Zahlen siehe HTML-Farbcodes mit der RGB-Farbkodierung. Drei Werte zwischen 0 und 255 (z. B. rgb (255, 153, 102) für hellorange) kodieren eine Farbe. Da die HTML-Kodes für Rot, Grün, Blau (RGB) ganzzahlige Zahlen sind, werden die tatsächlichen Werte des gleitenden Durchschnitts als technische Einschränkung gerundet.

Gleitender Mittelwert für Bilder (3) Bearbeiten

Das Bild   mit einer Höhe von   Pixel und einer Breite von   Pixel ist eine Matrix  , wobei jeder Eintrag der Matrix ein RGB-Tripel mit ganzzahligen Werten zwischen 0 und 255 ist, zum Beispiel  . Ein einzelner Pixel in Reihe   und Spalte   wird bezeichnet als  . Definieren wir  , dann ist die

  • Intensität von Rot  ,
  • Intensität von Grün  ,
  • Intensität von Blau  .

Gleitender Mittelwert für Bilder (4) Bearbeiten

Wenn wir die Farben berechnen und mitteln berechnen wir zuerst den Mittelwert von rot, grün und blau seperat. Zum Beispiel berechnen wir den Mittelwert einer  -Untermatrix eines Bildes/für die vier Pixel:

  •    
  •    

Der errechnete gerundete Mittelwert für diese Quadrat ist:

  • Rot:  
  • Grün:  
  • Blau:  

Gleitender Mittelwert für Bilder (5) Bearbeiten

Der errechnete Mittelwert der  -Untermatrix des Bildes   ersetzt alle ursprünglichen Farben in dem Quadrat. Sei   das Bild mit dem gleitenden Mittelwert angewendet für alle  -Untermatrizen, dann ist die oben beschriebene Untermatrix in   wie folgt:

  •    
  •    

Der letzte Schritt ordnet jedem Pixel der  -Untermatrix die gemittelte Farbe rgb(222,84,39) zu.

Gleitender Mittelwert für Bilder (6) Bearbeiten

Für die Bildverarbeitung   mit dem neutralen Element   der additiven Gruppe für die Addition gilt:

  und  

Gleitender Mittelwert für Bilder (7) Bearbeiten

  ist die Menge aller Zeilen- und Spaltenindizes der Pixel. Die Bilder werden in die Quadrate oder sogar Rechtecke   zerlegt. Der gleitende Durchschnitt wird für alle Pixel in dem Rechteck   ähnlich zur  -Matrix oben berechnet. Der berechnete gleitende Durchschnitt aus dem Originalbild   wird allen Pixeln des Quadrats / Rechtecks   in   zugewiesen. Wenn die Breite und Höhe der Rechtecke   im Allgemeinen eine Standardgröße haben, schließen sie die Ränder der Bilder. Die Größe dieser Rechtecke muss an die verbleibenden Pixel am rechten und unteren Rand des Bildes   angepasst werden.

Gewichteter gleitender Mittelwert Bearbeiten

Gewichteter gleitender Mittelwert (1) Bearbeiten

In der technischen Analyse von Finanzdaten hat ein gewichteter gleitender Durchschnitt (WMA) die spezifische Bedeutung von Gewichtungen, deren arithmetische Steigung abnimmt.[4] In einer  -Tag-WMA hat der letzte Tag ein Gewicht von  , das zweitletzte von   usw. bis zu  . Diese Gewichtungen erzeugen eine diskrete Wahrscheinlichkeitsverteilung mit:

  und  

Gewichteter gleitender Mittelwert (2) Bearbeiten

Der gewichtet gleitende Mittelwert kann für   mit einer diskreten Wahrscheinlichkeitsmassenverteilung   zur Zeit  , wobei   der erste Tag ist, an dem die Datenssammlung beginnt und   der Preis/die Kosten für ein Produkt am Tag   ist, berechent werden.   ist der Preis/die Kosten für ein Produkt am Tag   für jeden beliebigen Tag  .

 

 

Gewichteter gleitender Mittelwert (3) Bearbeiten

 

Die Abbildung zeigt eine WMA mit der Gewichtung n = 15.

Gewichteter gleitender Mittelwert (4) Bearbeiten

Der Nenner ist eine Dreieckszahl mit dem Wert  , die eine diskrete Wahrscheinlichkeitsverteilung erzeugt durch:

 

Allgemein mit den Gewichten   ist der Nenner immer die Summe der individuellen Gewichte, zum Beispiel:

  und   als Gewicht für das neueste Datum am Tag   und   als Gewicht für den Tag  , welcher der  -te Tag vor dem neuesten Tag   ist.

Gewichteter gleitender Mittelwert (5) Bearbeiten

Die diskrete Wahrscheinlichkeitsverteilung   ist definiert als

 

Der gewichtet gleitende Mittelwert mit beliebigen Gewichten wird ermittelt durch

 

 

Dieser allgemeine Ansatz kann mit den Gewichtungen im exponentiellen gleitenden Durchschnitt im folgenden Abschnitt verglichen werden.

Exponentieller gleitender Mittelwert Bearbeiten

Exponentieller gleitender Mittelwert (1) Bearbeiten

 

Die Abbildung zeigt eine EMA mit der Gewichtung  N = 200.

Exponentieller gleitender Mittelwert (2) Bearbeiten

Ein exponentiell gleitender Durchschnitt (EMA), auch bekannt als exponentiell gewichteter gleitender Durchschnitt (EWMA)[5], ist ein Typ eines unendlichen Impulsantwortfilters, der Gewichtungsfaktoren anwendet, die exponentiell abnehmen. Die Gewichtung für jedes ältere Datum nimmt exponentiell ab und erreicht niemals Null.

Exponentieller gleitender Mittelwert (3) Bearbeiten

Der EMA für eine Reihe   von gesammelten Daten mit Datumsangaben  , mit   den gesammelten Daten und dem Zeitindex  .

  • Als erstes wird ein   mit   definiert, welches die Abnahme der Gewichtung repräsentiert. Dieser Wert ist ein konstanter Glättungsfaktor zwischen 0 und 1. Ein geringes   vernachlässigt ältere Beobachtungen schneller.

Exponentieller gleitender Mittelwert (4) Bearbeiten

  • Die Gewichtung ist definiert durch
  für alle   mit   (geometrische Reihe).
  • Die Summe der Gewichtungen von 0 bis   ist definiert durch
 

 

  • Die diskrete Wahrscheinlichkeitsmassenfunktion ist definiert durch
 

Exponentieller gleitender Mittelwert (5) Bearbeiten

Diese Definition erzeugt den exponentiellen gleitenden Mittelwert EMA mit einer diskreten Wahrscheinlichkeitsmassenfunktion   durch

 

Der EMA zum Zeitpunkt   kann rekursiv berechnet werden:

  und
  für alle  

Exponentieller gleitender Mittelwert (6) Bearbeiten

Mit:

  • Der Koeffizient   repräsentiert den Grad der Verringerung der Gewichtung von   zu  . Dies führt das Altern der Daten von   zum Zeitindex   durch.
  • Der Bruch   passt den Nenner von   zu   an.
  • Der Koeffizient   im EMA zum Zeitpunkt  .

Die Initialisierung von EMA und die Beseitigung von Auswirkungen von alten Daten auf MA (1) Bearbeiten

  kann auf verschiedene Weisen initialisiert werden, am häufigsten durch Setzen von   auf die ersten gesammelten Daten   zum Zeitpunkt   wie oben gezeigt. Es existieren auch andere Techniken, beispielsweise das Starten der Berechnung des gleitenden Durchschnitts nach den ersten 4 oder 5 Beobachtungen. Außerdem kann nur eine letzte Teilmenge der vor dem Zeitpunkt   gesammelten Daten aus der Gesamthistorie der erfassten Daten für das   verwendet werden.

Die Initialisierung von EMA und die Beseitigung von Auswirkungen von alten Daten auf MA (2) Bearbeiten

Die diskrete Wahrscheinlichkeitsmassenfunktion bewertet die jüngsten  -Werte der gesammelten Daten mit:

 

 

Die Initialisierung von EMA und die Beseitigung von Auswirkungen von alten Daten auf MA (3) Bearbeiten

Die Einschränkungen der aktuellsten   Werte der gesammelten Daten eliminieren den Einfluss sehr alter Daten auf den resultierenden gleitenden Durchschnitt vollständig. Durch die Auswahl eines kleinen   sind alte Daten weniger wichtig als aktuelle Daten, und ältere Beobachtungen werden schneller abgewertet, aber selbst die ältesten Daten wirken sich auf die Berechnung von   zum Zeitpunkt   aus.

Die Initialisierung von EMA und die Beseitigung von Auswirkungen von alten Daten auf MA (4) Bearbeiten

Die Initialisierung von   könnte etwas über die Werte vor den verfügbaren Daten enthalten, d.h. die Historie vor  . Die Initialisierung könnte einen Fehler in der   verursachen. In Anbetracht dessen sollten die ersten Ergebnisse als unzuverlässig angesehen werden, bis die Iterationen Zeit hatten, zu konvergieren. Dies wird manchmal als "Anlaufintervall" bezeichnet.

Diese Formulierung von EMA ist als Anwendung eines Erwartungswerts konzipiert, der eine Standarddefinition in der Wahrscheinlichkeitstheorie ist.

Die Initialisierung von EMA und die Beseitigung von Auswirkungen von alten Daten auf MA (5) Bearbeiten

Nach Hunter (1986)[6] kann dies als wiederholte Anwendung der rekursiven Formel für verschiedene Zeiten   ohne Standardisierung geschrieben werden, d. h.

 

Bei einem von Roberts (1959)[7] definierten alternativen Ansatz fehlt auch die Standardisierung der Wahrscheinlichkeitsverteilung, während das Grundprinzip des exponentiellen gleitenden Durchschnitts unverändert bleibt.

Anwendung zur Messung von Computerleistung (1) Bearbeiten

Einige Computerleistungskennzahlen, z.B. die durchschnittliche Länge der Prozesswarteschlange oder die durchschnittliche CPU-Auslastung, verwenden bei der rekursiven Definition eine Form des exponentiellen gleitenden Durchschnitts.

 

  wird hier als Funktion der Zeit zwischen zwei Ablesungen definiert.

Anwendung zur Messung von Computerleistung (2) Bearbeiten

Ein Beispiel für einen Koeffizienten, der den aktuellen Messwerten ein größeres Gewicht und den älteren Messwerten ein geringeres Gewicht gibt ist

 ,

wobei   die Exponentialfunktion ist, die Zeit für die Ablesung   wird in Sekunden ausgedrückt und   ist der Zeitraum in Minuten, über den der gemessene Wert gemittelt werden soll (die mittlere Lebensdauer jedes Messwerts im Durchschnitt).

Anwendung zur Messung von Computerleistung (3) Bearbeiten

In Anbetracht der obigen Definition von   kann der gleitende Durchschnitt ausgedrückt werden als

 .

Anwendung zur Messung von Computerleistung (4) Bearbeiten

Beispielsweise wird ein 15-Minuten-Durchschnitt   einer Prozesswarteschlangenlänge  , der alle 5 Sekunden gemessen wird (Zeitunterschied beträgt 5 Sekunden), berechnet mittels

 
 
 

Wahrscheinlichkeitsverteilung als Verteilung der Bedeutung Bearbeiten

Wahrscheinlichkeitsverteilung als Verteilung der Bedeutung (1) Bearbeiten

Die Definition des Erwartungswerts bildet die mathematische Grundlage für die Verschiebung von Durchschnittswerten in der diskreten und kontinuierlichen Einstellung, und die mathematische Theorie ist nur eine Anwendung grundlegender Prinzipien der Wahrscheinlichkeitstheorie. Trotzdem ist der Begriff der Wahrscheinlichkeit etwas irreführend, da sich die Semantik des gleitenden Durchschnitts nicht auf die Wahrscheinlichkeit von Ereignissen bezieht. Die Wahrscheinlichkeit muss als Verteilung der Wichtigkeit betrachtet werden.

Wahrscheinlichkeitsverteilung als Verteilung der Bedeutung (2) Bearbeiten

In Zeitreihen wird z.B. älteren Daten eine geringere Bedeutung beigemessen, was nicht bedeutet, dass ältere Daten weniger wahrscheinlich sind als aktuelle Daten. Die Ereignisse, aus denen die gesammelten Daten erstellt werden, werden im Allgemeinen nicht aus der Wahrscheinlichkeitssicht betrachtet.

Die Bedeutung kann definiert werden, indem die Durchschnittswerte verschoben werden.

  • zeitliche Nähe (alte und aktuelle Daten)
  • räumliche Nähe (siehe Anwendung des gleitenden Durchschnitts auf Bildern oben)

Wahrscheinlichkeitsverteilung als Verteilung der Bedeutung (3) Bearbeiten

Um diese Nähe zu quantifizieren kann eine Metrik oder Norm, welche auf dem zugrunde liegenden Vektorraum   definiert ist, genutzt werden. Eine größere Entfernung zum Referenzpunkt   steht für eine geringere Bedeutung, zum Beispiel durch

 

Wahrscheinlichkeitsverteilung als Verteilung der Bedeutung (4) Bearbeiten

Die Gewichtung der Bedeutung ist 1 für  . Für eine wachsende durch die Norm   gemessene Distanz geht die Gewichtung gegen 0. Standardisiert mit   als Summe aller Gewichtungen für diskrete gleitende Mittelwerte (wie in EMA erwähnt) führt dies zur Eigenschaft von Wahrscheinlichkeitsverteilungen:

 

Wahrscheinlichkeitsverteilung als Verteilung der Bedeutung (5) Bearbeiten

Darüber hinaus gibt es andere gleitende Durchschnitte, die negative Gewichte enthalten. Dies führt dazu, dass  . Dies kann passieren, wenn die positive / negative Auswirkung   der gesammelten Daten   der Gewichts- und der Wahrscheinlichkeitsmassenfunktion zugeordnet werden. Die Zuordnung der Einflussfaktoren der erfassten Daten zu den Wahrscheinlichkeits- / Wichtigkeitswerten kombiniert zwei verschiedene Eigenschaften.

Wahrscheinlichkeitsverteilung als Verteilung der Bedeutung (6) Bearbeiten

Dies sollte vermieden werden, und die Auswirkung   auf   sollte für eine transparente Definition des gleitenden Durchschnitts getrennt gehalten werden, d. h.

  mit  

Andere Gewichtungen (1) Bearbeiten

Andere Gewichtungssysteme werden gelegentlich verwendet. Beispielsweise wird im Aktienhandel eine Volumengewichtung für jeden Zeitraum proportional zu seinem Handelsvolumen gewichtet.

Eine weitere Gewichtung, die von Aktuaren verwendet wird, ist Spencers 15-Punkte-Durchschnitt[8] (ein zentraler gleitender Durchschnitt). Die symmetrischen Gewichtungskoeffizienten sind –3, –6, –5, 3, 21, 46, 67, 74, 67, 46, 21, 3, –5, –6, –3.

Andere Gewichtungen (2) Bearbeiten

Außerhalb der Finanzwelt haben gewichtete Laufmittel viele Formen und Anwendungen. Jede Gewichtungsfunktion oder "Kern" hat ihre eigenen Merkmale. In Technik und Wissenschaft ist die Frequenz- und Phasenantwort des Filters oft von grundlegender Bedeutung für das Verständnis der gewünschten und unerwünschten Verzerrungen, die ein bestimmter Filter auf die Daten anwendet.

Andere Gewichtungen (3) Bearbeiten

Ein Mittelwert "glättet" nicht nur die Daten. Ein Mittelwert ist eine Form eines Tiefpassfilters. Die Auswirkungen des speziellen verwendeten Filters sollten verstanden werden, um eine geeignete Auswahl zu treffen. In diesem Zusammenhang werden in der französischen Version dieses Artikels die spektralen Auswirkungen von drei Arten von Mitteln (kumulativ, exponentiell, Gauß) beschrieben.

Gleitender Median (1) Bearbeiten

Statistisch betrachtet ist der gleitende Durchschnitt, wenn er zur Abschätzung des zugrunde liegenden Trends in einer Zeitreihe verwendet wird, anfällig für seltene Ereignisse wie schnelle Schocks oder andere Anomalien. Eine robustere Schätzung des Trends ist der einfache gleitende Median über   Zeitpunkte:

 

Dabei wird der Median ermittelt, indem z. B. die Werte in den Klammern sortiert und der Wert in der Mitte ermittelt wird. Bei größeren Werten von   kann der Medianwert effizient durch Aktualisieren einer indexierbaren skip list berechnet werden[9].

Gleitender Median (2) Bearbeiten

Statistisch ist der gleitende Durchschnitt optimal, um den zugrunde liegenden Trend der Zeitreihe wiederherzustellen, wenn die Schwankungen des Trends normal verteilt sind. Die Normalverteilung hat jedoch keine große Wahrscheinlichkeit für sehr große Abweichungen vom Trend, was erklärt, warum sich solche Abweichungen überproportional auf die Trendschätzung auswirken. Es kann gezeigt werden, dass, wenn die Fluktuationen stattdessen als Laplace-Verteilung angenommen werden, der bewegliche Medianwert statistisch optimal ist[10].

Gleitender Median (3) Bearbeiten

Bei einer gegebenen Varianz setzt die Laplace-Verteilung bei seltenen Ereignissen eine höhere Wahrscheinlichkeit an als die Normalverteilung. Dies erklärt, warum der Median der Bewegung mediale Schocks besser toleriert als der gleitende Mittelwert.

Wenn der einfache mittlere Medianwert oben zentral ist, ist die Glättung identisch mit dem Medianfilter, das beispielsweise in der Bildsignalverarbeitung Anwendung findet.

Modell der gleitenden durchschnittlichen Regression Bearbeiten

In einem Regressionsmodell mit gleitendem Durchschnitt wird angenommen, dass eine Variable von Interesse ein gewichteter gleitender Durchschnitt von unbeobachteten unabhängigen Fehlerausdrücken ist; die Gewichte im gleitenden Durchschnitt sind zu schätzende Parameter.

Diese beiden Konzepte werden oft aufgrund ihres Namens vertauscht, aber obwohl sie viele Ähnlichkeiten aufweisen, stellen sie unterschiedliche Methoden dar und werden in sehr unterschiedlichen Kontexten verwendet.

Siehe auch Bearbeiten

Externe Links Bearbeiten

Download Excel file to calculate SMA & EMA

Seiteninformation Bearbeiten

This page was based on the following wikipedia-source page:

Notizen und Referenzen Bearbeiten

  1. Hydrologic Variability of the Cosumnes River Floodplain (Booth et al., San Francisco Estuary and Watershed Science, Volume 4, Issue 2, 2006)
  2. Statistical Analysis, Ya-lun Chou, Holt International, 1975, ISBN|0-03-089422-0, section 17.9.
  3. The derivation and properties of the simple central moving average are given in full at Savitzky–Golay filter
  4. Weighted Moving Averages: The Basics. Investopedia..
  5. http://lorien.ncl.ac.uk/ming/filter/filewma.htm
  6. NIST/SEMATECH e-Handbook of Statistical Methods: Single Exponential Smoothing at the National Institute of Standards and Technology
  7. NIST/SEMATECH e-Handbook of Statistical Methods: EWMA Control Charts at the National Institute of Standards and Technology
  8. Spencer's 15-Point Moving Average — from Wolfram MathWorld
  9. http://code.activestate.com/recipes/576930/
  10. G.R. Arce, "Nonlinear Signal Processing: A Statistical Approach", Wiley:New Jersey, USA, 2005.