Kurs:Stochastik/Gleitender Mittelwert
Einführung
BearbeitenDie Abbildung zeigt ein Beispiel zweier Kurven (blaue bzw. rot), wobei die blaue Kurve den Verlauf der Rohdaten und die rote den Verlauf des gleitenden Mittelwertes.
Gleitender Mittelwert in der Statistik
BearbeitenIn der Statistik ist der Gleitende Mittelwert (oder auch gleitendes Mittel, gleitender Durchschnitt [1]) eine Möglichkeit zur Analyse von Daten durch das Erstellen einer Serie von Mittelwerten über verschieden große Datenintervalle der Gesamtdaten. Mögliche Variationen sind einfache, kumulative oder auch gewichtete Formen (Beschreibung siehe unten).
Begriffsklärung
BearbeitenMathematische Definition der beiden Teile des Begriffes "gleitender" und "Mittelwert":
- gleitend als additive Operation in einem Vektorraum (kontinuierlich) oder einer additive Gruppe (diskret). Es gibt eine sich im Raum bewegende Referenzposition.
- Mittelwert im Sinne von Mittelwert über Daten von Teilintervallen bezüglich eines Referenzpunktes im Raum (verallgemeinert: Erwartungswert für die Referenzposition).
Beispiel für ein Verfahren der Berechnung
BearbeitenMittels einer Serie von Werten und einer vordefinierten Intervallbreite wird das erste Element des gleitenden Mittelwertes berechnet, indem der Mittelwert des ersten Werteintervalls berechnet wird. Dann wird das Intervall durch "vorwärts bewegen" modifiziert, indem der erste Wert heraus genommen und der nächste Wert hinzugefügt wird.
Zeitabhängigkeit von Daten
BearbeitenEin gleitender Mittelwert wird häufig im Zusammenhang mit zeitabhängigen Daten genutzt, um die Auswirkungen von kurzzeitigen Fluktuationen zu verringern und Trends oder Zyklen zu betonen. Der Unterschied zwischen kurz- und langfristig hängt von der Anwendung ab und die Parameter des gleitenden Mittelwertes werden dementsprechend gewählt. Zum Beispiel wird er häufig genutzt für die technische Analyse von Finanzdaten, wie zum Beispiel Preisen, Retouren und Handelsvolumen.
Verwendung in der Wirtschaft
BearbeitenEr wird auch in der Wirtschaft genutzt, um das Bruttoinlandsprodukt, Beschäftigungszahlen oder andere makroökonomische zeitliche Verläufe zu untersuchen.
Mathematische Bezüge
BearbeitenMathematisch gesehen ist ein gleitender Mittelwert eine Faltung und kann somit als ein Beispiel für einen Tiefpassfilter in der Signalverarbeitung gesehen werden. Wenn er für nicht zeitabhängige Daten verwendet wird, ist normalerweise eine andere Art der Ordnung vorhanden. Vereinfacht betrachtet kann dieses Verfahren als Glättung der Daten angesehen werden.
Allgemeiner Ansatz zum gleitenden Durchschnitt
BearbeitenEin Element bewegt sich in einer additiven Gruppe oder einem Vektorraum . Allgemein haben wir eine Wahrscheinlichkeitsverteilung , welche den Einfluss der Werte in der Umgebung um beschreibt.
Diskreter/Kontinuierlicher gleitender Mittelwert
BearbeitenWie auch bei Wahrscheinlichkeitsverteilungen müsssen wir unterscheiden zwischen einem
- diskreten (Wahrscheinlichkeitsmassenverteilung ) und
- kontinuierlichen ( Wahrscheinlichkeitsdichtefunktion )
gleitenden Mittelwert. Die Terminologie bezieht sich auf Wahrscheinlichkeitsverteilungen, und die Semantik der Wahrscheinlichkeitsmassen- / Dichtefunktion beschreibt die Verteilung der Gewichtungen um den Wert . Konkret bedeutet das, dass bedeutet, dass eine zwanzigprozentige Auswirkung auf den gleitenden Mittelwert von hat.
Verteilungen verschieben (1)
BearbeitenWenn die Wahrscheinlichkeitsverteilung um in verschoben wird, bedeutet dies, dass die Wahrscheinlichkeitsmassenfunktionen beziehungsweise die Wahrscheinlichkeitsdichtefunktionen durch eine Wahrscheinlichkeitsverteilung am Nullelement der erzeugten additiven Gruppe bzw. am Nullvektor des Vektorraums generiert werden. Aufgrund der Beschaffenheit der gesammelten Daten existiert für eine Teilmenge . In vielen Fällen sind die Zeitpunkte, zu denen Daten erhoben werden.
Verteilungen verschieben (2)
BearbeitenDies und die Verschiebung einer Verteilung wird durch die folgende Eigenschaft definiert:
- diskret: Für alle ist die Wahrscheinlichkeitsmassenfunktion erfüllt für
- kontinuierlich: Alle erfüllen die Wahrscheinlichkeitsdichtenfunktion
Der gleitende Mittelwert ist definiert durch
- diskret: (Wahrscheinlichkeitsmassenfunktion )
Verteilungen verschieben (3)
BearbeitenMerke: für eine abzählbare Teilmenge von .
- kontinuierlich (Wahrscheinlichkeitsdichtefunktion )
Es ist wichtig für die Definition von Wahrscheinlichkeitsmassenfunktionen beziehungsweise Wahrscheinlichkeitsdichtefunktionen , dass der Träger von eine Teilmenge von ist. Dadurch wird sichergestellt, dass den erfassten Daten 100% der Wahrscheinlichkeitsmasse zugeordnet werden. Der Träger von ist definiert als:
- .
Einfacher gleitender Mittelwert - diskret
BearbeitenDer Glättung einer interpolierte Datenreihe, dessen Daten einer verrauschte Sinusfunktion entsprechen.
Einfacher gleitender Mittelwert - diskret (1)
BearbeitenIn Finanzanwendungen ist ein einfacher gleitender Mittelwert (SMA) der ungewichtete Durchschnitt der vorherigen Daten. In Wissenschaft und Technik wird der Mittelwert jedoch normalerweise von einer gleichen Anzahl von Daten auf beiden Seiten eines zentralen Werts genommen. Dies stellt sicher, dass die Abweichungen im Mittelwert mit den Abweichungen in den Daten übereinstimmen und nicht zeitlich verschoben werden. Ein Beispiel für einen einfachen gleichgewichteten laufenden Mittelwert für eine -Tage-Stichprobe des Schlusskurses ist der Mittelwert der Schlusskurse der letzten Tage.
Einfacher gleitender Mittelwert - diskret (2)
Bearbeitenund für mit als additive Gruppe.
Sei der Preis eines Produktes zu einem Zeitpunkt . Wenn die Preise sind und wir einen einfachen gleitenden Mittelwert am Tag ermitteln wollen mit einem zeitlichen Rückblick von Tagen, dann ist die Formel
- .
Einfacher gleitender Mittelwert - diskret (3)
BearbeitenDie sukzessive Berechnung weiterer Werte für andere Tage erfolgt, indem ein neuer Wert in die Summe aufgenommen wird und ein alter Wert heraus fällt, was bedeutet, dass eine vollständige Summation jedes Mal für diesen einfachen Fall unnötig ist.
Einfacher gleitender Mittelwert - diskret (4)
BearbeitenDer gewählte Zeitraum hängt von der Art der zu beobachtenden Bewegung ab, wie kurz-, mittel- oder langfristig. In finanzieller Hinsicht kann das Niveau des gleitenden Durchschnitts als Unterstützung in einem fallenden Markt oder als Widerstand in einem steigenden Markt interpretiert werden. Wenn Sie ein Diagramm für und die Kostenfunktion plotten, werden Sie feststellen, dass der Graph von in der Zeit weicher läuft.
Einfacher gleitender Mittelwert - diskret (5)
BearbeitenWenn die verwendeten Daten nicht um den Mittelwert zentriert sind, bleibt ein einfacher gleitender Mittelwert um die Hälfte der Abtastbreite hinter dem letzten Bezugspunkt zurück. Ein SMA kann auch durch das Herausfallen alter Bezugspunkte oder das Eintreffen neuer Daten überproportional beeinflusst werden. Eine Besonderheit des SMA ist, dass bei periodischen Schwankungen der Daten die Anwendung eines SMA dieser Periode diese Variation auslöst (der Durchschnittswert enthält immer einen vollständiger Zyklus). Ein vollkommen regelmäßiger Zyklus ist jedoch selten anzutreffen.[2]
Einfacher gleitender Mittelwert - diskret (6)
BearbeitenFür eine Reihe von Anwendungen ist es vorteilhaft, die Verschiebung zu vermeiden, die nur durch die Verwendung von Daten der Vergangenheit ausgelöst wird. Daher kann ein zentraler gleitender Mittelwert berechnet werden, indem Daten verwendet werden, die auf beiden Seiten des Punkts in der Reihe gleich beabstandet sind.[3] Dies erfordert die Verwendung einer ungeraden Anzahl von Bezugspunkten im Intervall.
Einfacher gleitender Mittelwert - diskret (7)
Bearbeitenund für mit als additive Gruppe.
Einfacher gleitender Mittelwert - diskret (8)
BearbeitenEin Hauptnachteil des SMA ist, dass er einen signifikanten Betrag des Signals durchlässt, der kürzer als die Fensterlänge ist. Schlimmer noch, er kehrt es tatsächlich um. Dies kann zu unerwarteten Artefakten führen, z. B. zu Peaks im geglätteten Ergebnis, die dort erscheinen, wo die Daten Tiefstwerte aufweisen. Dies führt auch dazu, dass das Ergebnis weniger glatt ist als erwartet, da einige der höheren Frequenzen nicht ordnungsgemäß entfernt wurden.
Einfacher gleitender Mittelwert - kontinuierlich
BearbeitenEinfacher gleitender Mittelwert - kontinuierlich (1)
BearbeitenMan betrachte eine kontinuierliche Messung eines Wertes, z.B. eine Kraft zum Zeitpunkt . Ziel ist es, die Werte mit einem kontinuierlichen einfachen gleitenden Durchschnitt zu glätten. Wir haben eine Zeitspanne von in der Vergangenheit. Als Wahrscheinlichkeitsverteilung verwenden wir eine Gleichverteilung für das Intervall . Die Dichtefunktion ist:
Einfacher gleitender Mittelwert - kontinuierlich (2)
Bearbeiten- und
Durch Anwendung auf die Definition des gleitenden Durchschnitts für kontinuierliche Wahrscheinlichkeitsverteilungen erhalten wir:
Kumulativer gleitender Mittelwert
BearbeitenKumulativer gleitender Mittelwert - diskret (1)
BearbeitenIn einem kumulativen gleitenden Durchschnitt kommen die Daten in einem geordneten Datenstrom mit an und der Benutzer möchte den Durchschnitt aller Daten bis zum aktuellen Wert (Bezugspunkt ) erhalten. Zum Beispiel kann ein Anleger den Durchschnittspreis aller Aktiengeschäfte für eine bestimmte Aktie bis zum aktuellen Zeitpunkt wünschen. Der Startpunkt der Datenerfassung ist .
Kumulativer gleitender Mittelwert - diskret (2)
BearbeitenBei jeder neuen Transaktion kann der Durchschnittspreis zum Zeitpunkt der Transaktion für alle bis zu diesem Zeitpunkt durchgeführten Transaktionen unter Verwendung des kumulativen Durchschnitts berechnet werden, üblicherweise eines gleichgewichteten Durchschnitts von einer Folge von Werten bis zum aktuellen Zeitpunkt :
Kumulativer gleitender Mittelwert - diskret (3)
BearbeitenDie umständliche Methode dies zu berechnen würde darin bestehen, alle Daten zu speichern, die Summe zu berechnen und durch die Anzahl der Bezugspunkte zu dividieren, wenn ein neuer Bezugspunkt hinzu kommt. Es ist jedoch möglich, den kumulativen Mittelwert einfach als neuen Wert zu aktualisieren. wird mit der folgenden Formel emittelt:
Kumulativer gleitender Mittelwert - diskret (4)
BearbeitenSomit ist der aktuelle kumulative Durchschnitt für einen neuen Datenpunkt gleich dem vorherigen kumulativen Durchschnitt zum Zeitpunkt multipliziert mit plus dem letzten Datenpunkt und alle geteilt durch die Anzahl der bisherigen Punkte . Wenn alle Bezugspunkte ankommen ( ), entspricht der kumulative Durchschnitt dem endgültigen Durchschnitt. Es ist auch möglich, eine laufende Summe des Bezugspunkts sowie die Anzahl der Punkte zu speichern und die Summe durch die Anzahl der Bezugspunkte zu teilen, um den CMA jedes Mal zu erhalten, wenn ein neuer Bezugspunkt ankommt.
Kumulativer gleitender Mittelwert - diskret (5)
BearbeitenDie Herleitung der kumulierten Durchschnittsformel ist unkompliziert. Mit
und in gleicher Weise für , ist zu erkennen, dass
- gilt.
Durch das Umstellen der Gleichung nach erhält man
Kumulativer gleitender Mittelwert - kontinuierlich (1)
BearbeitenWenn wir eine kontinuierliche Messung von Werten, zum Beispiel einer Kraft zum Zeitpunkt annehmen, ist das Ziel die Glättung dieser Werte mit einem kontinuierlichen aggregierenden gleitenden Mittelwert. Betrachtet werde eine Zeitspanne in der Vergangenheit. Als Wahrscheinlichkeitsverteilung nutzen wir eine gleichmäßige Verteilung auf dem Intervall . Die Dichtefunktion lautet
Kumulativer gleitender Mittelwert - kontinuierlich (2)
BearbeitenDurch Anwendung auf die Definition des kumulativen gleitenden Mittelwertes für kontinuierliche Wahrscheinlichkeitsverteilungen erhalten wir
Gleitender Mittelwert für Bilder
BearbeitenGleitender Mittelwert für Bilder (1)
BearbeitenEin gewichteter Durchschnitt ist ein Durchschnitt, der Multiplikationsfaktoren aufweist, um Daten an verschiedenen Positionen im Abtastfenster unterschiedlich zu gewichten. Mathematisch ist der gleitende Durchschnitt die Faltung der Bezugspunkte mit einer festen Gewichtungsfunktion. Eine Anwendung stellt eine Pixelisierung aus einem digitalen Grafikbild dar. Für alle Bilder wird die Pixelisierung für mehrere Quadrate angewendet. Alle Pixel im Quadrat werden durch den Farbmittelwert jener ersetzt. Da Farben durch drei ganzzahlige Zahlen definiert werden, muss der Farbmittelwert für diese Anwendung gerundet werden.
Gleitender Mittelwert für Bilder (2)
BearbeitenZum Verständnis der Farbkodierung mit ganzzahligen Zahlen siehe HTML-Farbcodes mit der RGB-Farbkodierung. Drei Werte zwischen 0 und 255 (z. B. rgb (255, 153, 102) für hellorange) kodieren eine Farbe. Da die HTML-Kodes für Rot, Grün, Blau (RGB) ganzzahlige Zahlen sind, werden die tatsächlichen Werte des gleitenden Durchschnitts als technische Einschränkung gerundet.
Gleitender Mittelwert für Bilder (3)
BearbeitenDas Bild mit einer Höhe von Pixel und einer Breite von Pixel ist eine Matrix , wobei jeder Eintrag der Matrix ein RGB-Tripel mit ganzzahligen Werten zwischen 0 und 255 ist, zum Beispiel . Ein einzelner Pixel in Reihe und Spalte wird bezeichnet als . Definieren wir , dann ist die
- Intensität von Rot ,
- Intensität von Grün ,
- Intensität von Blau .
Gleitender Mittelwert für Bilder (4)
BearbeitenWenn wir die Farben berechnen und mitteln berechnen wir zuerst den Mittelwert von rot, grün und blau seperat. Zum Beispiel berechnen wir den Mittelwert einer -Untermatrix eines Bildes/für die vier Pixel:
Der errechnete gerundete Mittelwert für diese Quadrat ist:
- Rot:
- Grün:
- Blau:
Gleitender Mittelwert für Bilder (5)
BearbeitenDer errechnete Mittelwert der -Untermatrix des Bildes ersetzt alle ursprünglichen Farben in dem Quadrat. Sei das Bild mit dem gleitenden Mittelwert angewendet für alle -Untermatrizen, dann ist die oben beschriebene Untermatrix in wie folgt:
Der letzte Schritt ordnet jedem Pixel der -Untermatrix die gemittelte Farbe rgb(222,84,39) zu.
Gleitender Mittelwert für Bilder (6)
BearbeitenFür die Bildverarbeitung mit dem neutralen Element der additiven Gruppe für die Addition gilt:
- und
Gleitender Mittelwert für Bilder (7)
Bearbeitenist die Menge aller Zeilen- und Spaltenindizes der Pixel. Die Bilder werden in die Quadrate oder sogar Rechtecke zerlegt. Der gleitende Durchschnitt wird für alle Pixel in dem Rechteck ähnlich zur -Matrix oben berechnet. Der berechnete gleitende Durchschnitt aus dem Originalbild wird allen Pixeln des Quadrats / Rechtecks in zugewiesen. Wenn die Breite und Höhe der Rechtecke im Allgemeinen eine Standardgröße haben, schließen sie die Ränder der Bilder. Die Größe dieser Rechtecke muss an die verbleibenden Pixel am rechten und unteren Rand des Bildes angepasst werden.
Gewichteter gleitender Mittelwert
BearbeitenGewichteter gleitender Mittelwert (1)
BearbeitenIn der technischen Analyse von Finanzdaten hat ein gewichteter gleitender Durchschnitt (WMA) die spezifische Bedeutung von Gewichtungen, deren arithmetische Steigung abnimmt.[4] In einer -Tag-WMA hat der letzte Tag ein Gewicht von , das zweitletzte von usw. bis zu . Diese Gewichtungen erzeugen eine diskrete Wahrscheinlichkeitsverteilung mit:
- und
Gewichteter gleitender Mittelwert (2)
BearbeitenDer gewichtet gleitende Mittelwert kann für mit einer diskreten Wahrscheinlichkeitsmassenverteilung zur Zeit , wobei der erste Tag ist, an dem die Datenssammlung beginnt und der Preis/die Kosten für ein Produkt am Tag ist, berechent werden. ist der Preis/die Kosten für ein Produkt am Tag für jeden beliebigen Tag .
Gewichteter gleitender Mittelwert (3)
BearbeitenDie Abbildung zeigt eine WMA mit der Gewichtung n = 15.
Gewichteter gleitender Mittelwert (4)
BearbeitenDer Nenner ist eine Dreieckszahl mit dem Wert , die eine diskrete Wahrscheinlichkeitsverteilung erzeugt durch:
Allgemein mit den Gewichten ist der Nenner immer die Summe der individuellen Gewichte, zum Beispiel:
und als Gewicht für das neueste Datum am Tag und als Gewicht für den Tag , welcher der -te Tag vor dem neuesten Tag ist.
Gewichteter gleitender Mittelwert (5)
BearbeitenDie diskrete Wahrscheinlichkeitsverteilung ist definiert als
Der gewichtet gleitende Mittelwert mit beliebigen Gewichten wird ermittelt durch
Dieser allgemeine Ansatz kann mit den Gewichtungen im exponentiellen gleitenden Durchschnitt im folgenden Abschnitt verglichen werden.
Exponentieller gleitender Mittelwert
BearbeitenExponentieller gleitender Mittelwert (1)
BearbeitenDie Abbildung zeigt eine EMA mit der Gewichtung N = 200.
Exponentieller gleitender Mittelwert (2)
BearbeitenEin exponentiell gleitender Durchschnitt (EMA), auch bekannt als exponentiell gewichteter gleitender Durchschnitt (EWMA)[5], ist ein Typ eines unendlichen Impulsantwortfilters, der Gewichtungsfaktoren anwendet, die exponentiell abnehmen. Die Gewichtung für jedes ältere Datum nimmt exponentiell ab und erreicht niemals Null.
Exponentieller gleitender Mittelwert (3)
BearbeitenDer EMA für eine Reihe von gesammelten Daten mit Datumsangaben , mit den gesammelten Daten und dem Zeitindex .
- Als erstes wird ein mit definiert, welches die Abnahme der Gewichtung repräsentiert. Dieser Wert ist ein konstanter Glättungsfaktor zwischen 0 und 1. Ein geringes vernachlässigt ältere Beobachtungen schneller.
Exponentieller gleitender Mittelwert (4)
Bearbeiten- Die Gewichtung ist definiert durch
- für alle mit (geometrische Reihe).
- Die Summe der Gewichtungen von 0 bis ist definiert durch
- Die diskrete Wahrscheinlichkeitsmassenfunktion ist definiert durch
Exponentieller gleitender Mittelwert (5)
BearbeitenDiese Definition erzeugt den exponentiellen gleitenden Mittelwert EMA mit einer diskreten Wahrscheinlichkeitsmassenfunktion durch
Der EMA zum Zeitpunkt kann rekursiv berechnet werden:
- und
- für alle
Exponentieller gleitender Mittelwert (6)
BearbeitenMit:
- Der Koeffizient repräsentiert den Grad der Verringerung der Gewichtung von zu . Dies führt das Altern der Daten von zum Zeitindex durch.
- Der Bruch passt den Nenner von zu an.
- Der Koeffizient im EMA zum Zeitpunkt .
Die Initialisierung von EMA und die Beseitigung von Auswirkungen von alten Daten auf MA (1)
Bearbeitenkann auf verschiedene Weisen initialisiert werden, am häufigsten durch Setzen von auf die ersten gesammelten Daten zum Zeitpunkt wie oben gezeigt. Es existieren auch andere Techniken, beispielsweise das Starten der Berechnung des gleitenden Durchschnitts nach den ersten 4 oder 5 Beobachtungen. Außerdem kann nur eine letzte Teilmenge der vor dem Zeitpunkt gesammelten Daten aus der Gesamthistorie der erfassten Daten für das verwendet werden.
Die Initialisierung von EMA und die Beseitigung von Auswirkungen von alten Daten auf MA (2)
BearbeitenDie diskrete Wahrscheinlichkeitsmassenfunktion bewertet die jüngsten -Werte der gesammelten Daten mit:
Die Initialisierung von EMA und die Beseitigung von Auswirkungen von alten Daten auf MA (3)
BearbeitenDie Einschränkungen der aktuellsten Werte der gesammelten Daten eliminieren den Einfluss sehr alter Daten auf den resultierenden gleitenden Durchschnitt vollständig. Durch die Auswahl eines kleinen sind alte Daten weniger wichtig als aktuelle Daten, und ältere Beobachtungen werden schneller abgewertet, aber selbst die ältesten Daten wirken sich auf die Berechnung von zum Zeitpunkt aus.
Die Initialisierung von EMA und die Beseitigung von Auswirkungen von alten Daten auf MA (4)
BearbeitenDie Initialisierung von könnte etwas über die Werte vor den verfügbaren Daten enthalten, d.h. die Historie vor . Die Initialisierung könnte einen Fehler in der verursachen. In Anbetracht dessen sollten die ersten Ergebnisse als unzuverlässig angesehen werden, bis die Iterationen Zeit hatten, zu konvergieren. Dies wird manchmal als "Anlaufintervall" bezeichnet.
Diese Formulierung von EMA ist als Anwendung eines Erwartungswerts konzipiert, der eine Standarddefinition in der Wahrscheinlichkeitstheorie ist.
Die Initialisierung von EMA und die Beseitigung von Auswirkungen von alten Daten auf MA (5)
BearbeitenNach Hunter (1986)[6] kann dies als wiederholte Anwendung der rekursiven Formel für verschiedene Zeiten ohne Standardisierung geschrieben werden, d. h.
Bei einem von Roberts (1959)[7] definierten alternativen Ansatz fehlt auch die Standardisierung der Wahrscheinlichkeitsverteilung, während das Grundprinzip des exponentiellen gleitenden Durchschnitts unverändert bleibt.
Anwendung zur Messung von Computerleistung (1)
BearbeitenEinige Computerleistungskennzahlen, z.B. die durchschnittliche Länge der Prozesswarteschlange oder die durchschnittliche CPU-Auslastung, verwenden bei der rekursiven Definition eine Form des exponentiellen gleitenden Durchschnitts.
wird hier als Funktion der Zeit zwischen zwei Ablesungen definiert.
Anwendung zur Messung von Computerleistung (2)
BearbeitenEin Beispiel für einen Koeffizienten, der den aktuellen Messwerten ein größeres Gewicht und den älteren Messwerten ein geringeres Gewicht gibt ist
- ,
wobei die Exponentialfunktion ist, die Zeit für die Ablesung wird in Sekunden ausgedrückt und ist der Zeitraum in Minuten, über den der gemessene Wert gemittelt werden soll (die mittlere Lebensdauer jedes Messwerts im Durchschnitt).
Anwendung zur Messung von Computerleistung (3)
BearbeitenIn Anbetracht der obigen Definition von kann der gleitende Durchschnitt ausgedrückt werden als
- .
Anwendung zur Messung von Computerleistung (4)
BearbeitenBeispielsweise wird ein 15-Minuten-Durchschnitt einer Prozesswarteschlangenlänge , der alle 5 Sekunden gemessen wird (Zeitunterschied beträgt 5 Sekunden), berechnet mittels
Wahrscheinlichkeitsverteilung als Verteilung der Bedeutung
BearbeitenWahrscheinlichkeitsverteilung als Verteilung der Bedeutung (1)
BearbeitenDie Definition des Erwartungswerts bildet die mathematische Grundlage für die Verschiebung von Durchschnittswerten in der diskreten und kontinuierlichen Einstellung, und die mathematische Theorie ist nur eine Anwendung grundlegender Prinzipien der Wahrscheinlichkeitstheorie. Trotzdem ist der Begriff der Wahrscheinlichkeit etwas irreführend, da sich die Semantik des gleitenden Durchschnitts nicht auf die Wahrscheinlichkeit von Ereignissen bezieht. Die Wahrscheinlichkeit muss als Verteilung der Wichtigkeit betrachtet werden.
Wahrscheinlichkeitsverteilung als Verteilung der Bedeutung (2)
BearbeitenIn Zeitreihen wird z.B. älteren Daten eine geringere Bedeutung beigemessen, was nicht bedeutet, dass ältere Daten weniger wahrscheinlich sind als aktuelle Daten. Die Ereignisse, aus denen die gesammelten Daten erstellt werden, werden im Allgemeinen nicht aus der Wahrscheinlichkeitssicht betrachtet.
Die Bedeutung kann definiert werden, indem die Durchschnittswerte verschoben werden.
- zeitliche Nähe (alte und aktuelle Daten)
- räumliche Nähe (siehe Anwendung des gleitenden Durchschnitts auf Bildern oben)
Wahrscheinlichkeitsverteilung als Verteilung der Bedeutung (3)
BearbeitenUm diese Nähe zu quantifizieren kann eine Metrik oder Norm, welche auf dem zugrunde liegenden Vektorraum definiert ist, genutzt werden. Eine größere Entfernung zum Referenzpunkt steht für eine geringere Bedeutung, zum Beispiel durch
Wahrscheinlichkeitsverteilung als Verteilung der Bedeutung (4)
BearbeitenDie Gewichtung der Bedeutung ist 1 für . Für eine wachsende durch die Norm gemessene Distanz geht die Gewichtung gegen 0. Standardisiert mit als Summe aller Gewichtungen für diskrete gleitende Mittelwerte (wie in EMA erwähnt) führt dies zur Eigenschaft von Wahrscheinlichkeitsverteilungen:
Wahrscheinlichkeitsverteilung als Verteilung der Bedeutung (5)
BearbeitenDarüber hinaus gibt es andere gleitende Durchschnitte, die negative Gewichte enthalten. Dies führt dazu, dass . Dies kann passieren, wenn die positive / negative Auswirkung der gesammelten Daten der Gewichts- und der Wahrscheinlichkeitsmassenfunktion zugeordnet werden. Die Zuordnung der Einflussfaktoren der erfassten Daten zu den Wahrscheinlichkeits- / Wichtigkeitswerten kombiniert zwei verschiedene Eigenschaften.
Wahrscheinlichkeitsverteilung als Verteilung der Bedeutung (6)
BearbeitenDies sollte vermieden werden, und die Auswirkung auf sollte für eine transparente Definition des gleitenden Durchschnitts getrennt gehalten werden, d. h.
- mit
Andere Gewichtungen (1)
BearbeitenAndere Gewichtungssysteme werden gelegentlich verwendet. Beispielsweise wird im Aktienhandel eine Volumengewichtung für jeden Zeitraum proportional zu seinem Handelsvolumen gewichtet.
Eine weitere Gewichtung, die von Aktuaren verwendet wird, ist Spencers 15-Punkte-Durchschnitt[8] (ein zentraler gleitender Durchschnitt). Die symmetrischen Gewichtungskoeffizienten sind –3, –6, –5, 3, 21, 46, 67, 74, 67, 46, 21, 3, –5, –6, –3.
Andere Gewichtungen (2)
BearbeitenAußerhalb der Finanzwelt haben gewichtete Laufmittel viele Formen und Anwendungen. Jede Gewichtungsfunktion oder "Kern" hat ihre eigenen Merkmale. In Technik und Wissenschaft ist die Frequenz- und Phasenantwort des Filters oft von grundlegender Bedeutung für das Verständnis der gewünschten und unerwünschten Verzerrungen, die ein bestimmter Filter auf die Daten anwendet.
Andere Gewichtungen (3)
BearbeitenEin Mittelwert "glättet" nicht nur die Daten. Ein Mittelwert ist eine Form eines Tiefpassfilters. Die Auswirkungen des speziellen verwendeten Filters sollten verstanden werden, um eine geeignete Auswahl zu treffen. In diesem Zusammenhang werden in der französischen Version dieses Artikels die spektralen Auswirkungen von drei Arten von Mitteln (kumulativ, exponentiell, Gauß) beschrieben.
Gleitender Median (1)
BearbeitenStatistisch betrachtet ist der gleitende Durchschnitt, wenn er zur Abschätzung des zugrunde liegenden Trends in einer Zeitreihe verwendet wird, anfällig für seltene Ereignisse wie schnelle Schocks oder andere Anomalien. Eine robustere Schätzung des Trends ist der einfache gleitende Median über Zeitpunkte:
Dabei wird der Median ermittelt, indem z. B. die Werte in den Klammern sortiert und der Wert in der Mitte ermittelt wird. Bei größeren Werten von kann der Medianwert effizient durch Aktualisieren einer indexierbaren skip list berechnet werden[9].
Gleitender Median (2)
BearbeitenStatistisch ist der gleitende Durchschnitt optimal, um den zugrunde liegenden Trend der Zeitreihe wiederherzustellen, wenn die Schwankungen des Trends normal verteilt sind. Die Normalverteilung hat jedoch keine große Wahrscheinlichkeit für sehr große Abweichungen vom Trend, was erklärt, warum sich solche Abweichungen überproportional auf die Trendschätzung auswirken. Es kann gezeigt werden, dass, wenn die Fluktuationen stattdessen als Laplace-Verteilung angenommen werden, der bewegliche Medianwert statistisch optimal ist[10].
Gleitender Median (3)
BearbeitenBei einer gegebenen Varianz setzt die Laplace-Verteilung bei seltenen Ereignissen eine höhere Wahrscheinlichkeit an als die Normalverteilung. Dies erklärt, warum der Median der Bewegung mediale Schocks besser toleriert als der gleitende Mittelwert.
Wenn der einfache mittlere Medianwert oben zentral ist, ist die Glättung identisch mit dem Medianfilter, das beispielsweise in der Bildsignalverarbeitung Anwendung findet.
Modell der gleitenden durchschnittlichen Regression
BearbeitenIn einem Regressionsmodell mit gleitendem Durchschnitt wird angenommen, dass eine Variable von Interesse ein gewichteter gleitender Durchschnitt von unbeobachteten unabhängigen Fehlerausdrücken ist; die Gewichte im gleitenden Durchschnitt sind zu schätzende Parameter.
Diese beiden Konzepte werden oft aufgrund ihres Namens vertauscht, aber obwohl sie viele Ähnlichkeiten aufweisen, stellen sie unterschiedliche Methoden dar und werden in sehr unterschiedlichen Kontexten verwendet.
Siehe auch
BearbeitenExterne Links
BearbeitenSeiteninformation
BearbeitenThis page was based on the following wikipedia-source page:
Notizen und Referenzen
Bearbeiten- ↑ Hydrologic Variability of the Cosumnes River Floodplain (Booth et al., San Francisco Estuary and Watershed Science, Volume 4, Issue 2, 2006)
- ↑ Statistical Analysis, Ya-lun Chou, Holt International, 1975, ISBN|0-03-089422-0, section 17.9.
- ↑ The derivation and properties of the simple central moving average are given in full at Savitzky–Golay filter
- ↑ Weighted Moving Averages: The Basics. Investopedia..
- ↑ http://lorien.ncl.ac.uk/ming/filter/filewma.htm
- ↑ NIST/SEMATECH e-Handbook of Statistical Methods: Single Exponential Smoothing at the National Institute of Standards and Technology
- ↑ NIST/SEMATECH e-Handbook of Statistical Methods: EWMA Control Charts at the National Institute of Standards and Technology
- ↑ Spencer's 15-Point Moving Average — from Wolfram MathWorld
- ↑ http://code.activestate.com/recipes/576930/
- ↑ G.R. Arce, "Nonlinear Signal Processing: A Statistical Approach", Wiley:New Jersey, USA, 2005.