Kurs:Statistik für Anwender/Kurzvorstellung weiterer Hypothesentests
Kurzvorstellung weiterer Tests
BearbeitenBeispiele siehe R-Skript unter GitHub.
In diesem Kapitel sollen einige weitere Tests vorgestellt werden, die für gewisse Anwendungen relevant sind. Auf die konkrete (meist kompliziertere) Durchführung (d.h. Berechnung der Testsstatistik und des p-Werts) gehen wir nur kurz oder gar nicht ein. Unverzichtbar ist jedoch das Verständnis der zum jeweiligen Test gehörenden Nullhypothese.
Der Kolmogoroff-Smirnov-Test
BearbeitenEinstichprobenfall
BearbeitenSituation, Nullhypothese und Daten
BearbeitenSituation: Gegeben sei eine beliebige stetige ZV .
Nullhypothese: ist nach verteilt (Anpassungstest)
mit einer hypothetischen (genau festgelegten) stetigen Verteilung mit Verteilungsfunktion
Benötigte Daten: Stichprobe
Teststatistik I
BearbeitenTeststatistik: Man bestimmt zunächst (in Abhängigkeit von ) die relative Häufigkeit der , die sind, also
heißt empirische Verteilungsfunktion der Stichprobe
und (zum Vergleich) die Wahrscheinlichkeit, dass ist (falls gilt), also
Teststatistik II
BearbeitenDie Teststatistik berechnet sich als die maximale Abweichung zwischen beiden Werten, also
Falls gilt, erwartet man nur eine geringe Abweichung zwischen den relativen Häufigkeiten und den entsprechenden Wahrscheinlichkeiten. Damit spricht ein hoher Wert von gegen .
p-Wert
Bearbeiten-Wert: Die Berechnung des p-Werts aus der Teststatistik ist kompliziert, hängt aber nicht von (sondern nur von ) ab. Man kann den -Wert mit Hilfe von Tabellen (für kleine ) oder Näherungsformeln (für große ) bestimmen. Wir wollen hier aber nicht näher auf die Berechnung eingehen.
Durchführung in R
BearbeitenDurchführung in R: mit dem Befehl ks.test: Einlesen der Stichprobe in einen Vektor und dann beispielsweise
falls eine Normalverteilung (mit gegebenem EW und gegebener SA ) ist
falls eine Exponentialverteilung mit (gegebenem Parameter ) ist
falls eine Gleichverteilung auf ist ( und gegeben)
falls eine Binomialverteilung mit gegebenem EW und gegebener SA ist
Beispiel 1.1
BearbeitenMan testet die Nullhypothese
anhand der folgenden Stichprobe :
Beispiel 1.2
Bearbeiten
Damit erstellt man nun einen Plot der empirischen Verteilungsfunktion zu dieser Stichprobe (schwarz) und zum Vergleich die hypothetische Verteilungsfunktion (rot) falls gilt, also:
(vergleiche die Verteilungsfunktion einer exponentialverteilten ZV)
Beispiel 1.3
BearbeitenBeispiel 1.4
BearbeitenDie Teststatistik ergibt sich als maximaler (vertikaler) Abstand der beiden Funktionsgraphen, es ist (im Bild grün eingezeichnet).
In R berechnet man diese Teststatistik und den -Wert einfach mit . Mit hat man hier ein hochsignifikantes Ergebnis, es ist als davon auszugehen, dass die Daten keiner Exponentialverteilung mit entstammen.
Variante: Test auf bestimmte Verteilung I
BearbeitenMan kann in manchen Fällen den KS-Test auch als Test auf eine bestimmte Verteilungsart einsetzen (z.B. Test auf Normalverteilung oder Test auf Exponentialverteilung), wobei man vor Berechnung der Teststatistik die unbekannten Parameter aus der Stichprobe schätzen muss. In diesem Fall ändert sich allerdings die Verteilung der Teststatistik. Die Berechnung des -Werts ist dann abhängig von der hypothetischen Verteilungsart und kann sehr aufwändig werden. Für bestimmte hypothetische Verteilungsarten existieren Variationen des KS-Tests, z.B. der Lilliefors-Test zum Testen auf Normalverteilung.
Variante: Test auf bestimmte Verteilung II
BearbeitenDie Nullhypothese ( : wahre Verteilungsfunktion von , : hypothetische Verteilungsfunktion) kann ersetzt werden durch
in R: mit ks.test und der Option alternative=" greater"
in R: mit ks.test und der Option alternative=" less"
Zweistichprobenfall
BearbeitenSituation, Nullhypothese und benötigte Daten
BearbeitenSituation: Gegeben seien zwei beliebige stetige ZV .
Nullhypothese: (Homogenitätstest)
benötigte Daten: unabhängige Stichproben und
Teststatistik
BearbeitenTeststatistik: Man bestimmt zunächst (in Abhängigkeit von ) für und die relative Häufigkeit der Stichprobenwerte, die sind, also
(empirische Verteilungsfunktionen der beiden Stichproben)
Die Teststatistik berechnet sich als die maximale Abweichung zwischen beiden Werten, also
. Falls gilt, erwartet man nur eine geringe Abweichung. Damit spricht ein hoher Wert von gegen .
p-Wert und Durchführung in R
Bearbeiten-Wert: Die Verteilung von ist kompliziert. Man kann den -Wert mit Hilfe von Tabellen (für kleine ) oder Näherungsformeln (für große ) bestimmen. Wir wollen hier aber nicht näher auf die Berechnung eingehen.
Durchführung in R: mit dem Befehl ks.test: Einlesen der Stichproben in Vektoren und dann
Variante
BearbeitenDie Nullhypothese ( bzw. : wahre Verteilungsfunktion von bzw. ) kann ersetzt werden durch
in R: mit ks.test und der Option alternative=" greater"
in R: mit ks.test und der Option alternative=" less"
Vorteile des KS-Tests
Bearbeiten- auch für kleine Stichproben geeignet.
- verteilungsfrei (es muss keine Verteilungsart vorausgesetzt werden).
- in R implementiert.
Nachteile des KS-Tests
Bearbeiten- recht aufwendig.
- anfällig gegenüber sogenannten "Bindungen". Treten in den Stichproben mehrfach dieselben Werte auf (z.B. künstlich erzeugt durch Runden), so liefert der KS-Test keine korrekten Resultate ( -Werte) mehr.
- für diskrete verteilte Größen nur noch bedingt einsetzbar: Die Berechnung des -Werts wird möglicherweise ungenau, die Güte des Tests wird geringer und es treten häufig Probleme mit oben erwähnten Bindungen auf.
Der Shapiro-Wilks-Test
BearbeitenSituation: Gegeben sei eine beliebige stetige ZV .
Nullhypothese: ist normalverteilt (Normalitätstest)
benötigte Daten: Stichprobe
Teststatistik und -Wert: kompliziert und aufwendig, wir wollen hier nicht näher darauf eingehen
Durchführung in R: Einlesen der Stichprobe in einen Vektor und dann
Beispiel
BearbeitenDa der Shapiro-wilks-Test vergleichbar mit dem Anpassungstest ist, kann auf dieses Beispiel zurückgegriffen werden und wird hier nicht weiter aufgeführt.
Vorteile des SW-Tests
Bearbeiten- auch für kleine Stichproben gut geeignet (man erzielt insbesondere dann schon eine hohe Güte).
- verteilungsfrei (es muss keine Verteilungsart vorausgesetzt werden).
- in R implementiert.
Nachteile des SW-Tests
Bearbeiten- sehr speziell (nur für die Normalverteilungshypothese einsetzbar).
- anfällig gegenüber ’Ausreißern’ (bei einigen extrem großen oder extrem kleinen Werten in der Stichprobe kann die Nullhypothese fälschlicherweise abgelehnt werden).
- anfällig gegenüber Bindungen.
- recht aufwendig (insbesondere für große ) und schwer verständlich.
Der Bartlett-Test
BearbeitenSituation und Nullhypothese
BearbeitenSituation: Gegeben seien normalverteilte ZV .
Nullhypothese: (’Dispersionsvergleich’)
Anmerkung: Die Varianzgleichheit ist für weitere Tests (insbesondere den noch folgenden F-Test) eine benötigte Voraussetzung. Mit einem Bartlett-Test kann dies vorab empirisch überprüft werden.
Benötigte Daten
Bearbeiten unabhängige Stichproben
Dabei sollte für gelten (Faustregel).
Teststatistik I
BearbeitenMan berechnet zunächst zu den einzelnen Stichproben:
- die arithmetischen Mittelwerte:
- die empirischen Varianzen
Daraus erhält man die sogenannte mittlere quadratische Abweichung der Fehler (’mean squared error’):
Teststatistik II
BearbeitenDaraus berechnet sich mit die Teststatistik als
p-Wert
Bearbeiten
Dabei ist die -Verteilung mit Freiheitsgraden.
Durchführung in R
BearbeitenEinlesen der Stichproben in einen gemeinsamen Vektor x zusammen mit einem Faktor g (gleicher Länge), der angibt zu welcher Größe die jeweiligen Komponenten von x gehören. Dann: bartlett.test(x ~ g)
Alternativ: Einlesen der einzelnen Stichproben in Vektoren, etwa x1,x2, ,xm und dann: bartlett.test(list(x1,x2, ,xm))
Anmerkung
BearbeitenDer Bartlett-Test ist anfällig gegenüberber Verletzungen der Normalverteilungsannahme. Sind die Größen nicht normalverteilt, so liefert der Test keine korrekten Resultate ( -Werte).
Beispiel 1.1
BearbeitenVerschiedene Drahtsorten ( ) werden auf Zugfestigkeit untersucht.
Wir nehmen an, dass die ZV , die die Zugfestigkeiten der verschiedenen Sorten beschreiben, normalverteilt mit den Standardabweichungen sind und untersuchen zunächst die Nullhypothese
Beispiel 1.2
BearbeitenMan erhält folgende Daten (in ):
Damit berechnet sich der -Wert als , es liegt also kein signifikantes Ergebnis vor.
Der Kruskal-Wallis-Rangsummentest
BearbeitenSituation, Nullhypothese und benötigte Daten
BearbeitenSituation: Gegeben seien beliebige ZV .
Nullhypothese: sind identisch verteilt (’Homogenitätstest’)
benötigte Daten: unabhängige Stichproben zu
Teststatistik und p-Wert
BearbeitenDies wollen wir an dieser Stelle nicht ausführen.
Man beachte aber, dass zur Durchführung des Tests nur die ’Ränge’ der Stichprobenwerte verwendet werden. Die Differenzen zwischen den Werten beeinflussen das Testergebnis nicht. Daher ist der Kruskal-Wallis-Test auch für ZV geeignet, deren Ausprägungen nur ordinalskaliert sind.
Durchführung in R
BearbeitenEinlesen der Stichproben in einen gemeinsamen Vektor x zusammen mit einem Faktor g (gleicher Länge), der angibt zu welcher Größe die jeweiligen Komponenten von x gehören. Dann: kruskal.test(x,g)
Alternativ: Einlesen der einzelnen Stichproben in Vektoren, etwa x1,x2, ,xm und dann: kruskal.test(list(x1,x2,...,xm))
Dixon’s Q-Test
BearbeitenMit dem Dixon’s -Test können Ausreißer identifiziert werden. Dieser Test soll unter anderem laut Dixon sparsam und maximal einmal pro Datensatz verwendet werden und kann für beide Seiten gleichermaßen verwendet werden.
Situation, Nullhypothese und Teststatistik
BearbeitenSituation: Gegeben sei eine normalverteilte ZV .
Nullhypothese:
Benötigte Daten: Geordnete Datenreihe mit Elementen.
Teststatistik : Für die Teststatistik wird die absolute Differenz zwischen dem zu untersuchenden Wert und dem nächsten Wert (da geordnete Datenreihe oder ) bestimmt und anschließend durch die Spannweite geteilt.
Verwerfen der Hypothese
BearbeitenGilt , so kann abgelehnt werden (d.h. ist kein Ausreißer). erhält man abhängig von der Stichprobengröße und dem Konvidenzniveau aus der entsprechenden Tabelle.
Beispiel
BearbeitenStichprobe mit Werten und Konvidenznveau :
ist ein Ausreißer.
kann abgelehnt werden - ist somit kein Ausreißer.
Seiteninformation
BearbeitenDiese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.
Wiki2Reveal
BearbeitenDieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.
- Die Seite wurde als Dokumententyp PanDocElectron-SLIDE erstellt.
- Link zur Quelle in Wikiversity: https://de.wikiversity.org/wiki/Kurs:Statistik%20f%C3%BCr%20Anwender/Kurzvorstellung%20weiterer%20Hypothesentests
- siehe auch weitere Informationen zu Wiki2Reveal und unter Wiki2Reveal-Linkgenerator.