Kurs:Statistik für Anwender/Chi-Quadrat-Tests

Verschiedene Χ²-Tests

Arten des Χ²-Tests

Vom ${\textstyle \chi ^{2}}$ -Test existieren verschiedene Varianten, mit denen man die folgenden Arten von Nullhypothesen untersuchen kann:

Anpassungstest bzw. Test auf Verteilung:
${\textstyle H_{0}}$ : Für eine ZV liegt eine bestimmte (angegebene) Verteilung vor.

Homogenitätstest:
${\textstyle H_{0}}$ : Zwei (oder mehr) unabhängige ZV haben dieselbe Verteilung.

Unabhängigkeitstest:
${\textstyle H_{0}}$ : Zwei (verbundene) ZV sind unabhängig voneinander.

Χ²-Anpassungstest:

Mit einem ${\textstyle \chi ^{2}}$ -Anpassungstest kann für eine diskrete oder stetige ZV getestet werden, ob eine ganz bestimmte (vermutete oder zu widerlegende) Verteilung vorliegen könnte.

Χ²-Anpassungstest für diskrete Verteilung

Voraussetzung, Hypothesenpaar und Daten

Voraussetzung: diskrete ZV ${\textstyle X}$ mit den möglichen Werten ${\textstyle a_{1},\ldots ,a_{m}}$

Hypothesenpaar: $H_{0}:\ P\left(X=a_{1}\right)=p_{1}\ ,\ P\left(X=a_{2}\right)=p_{2}\ ,\ \ldots \ ,\ P\left(X=a_{m}\right)=p_{m}$
$H_{1}:P(X=a_{k})\not =p_{k}\ {\text{für mindestens ein}}\ k\in \{1,\ldots ,m\}$ (Hierbei sind bestimmte (zu prüfende) Werte ${\textstyle p_{1},\ldots ,p_{m}}$ für die Wahrscheinlichkeiten ${\textstyle P(X=a_{1}),\ldots ,P(X=a_{m})}$ vorgegeben. Dabei muss natürlich ${\textstyle p_{1}+\ldots +p_{m}=1}$ gelten.)

Vorliegende Daten: Stichprobe ${\textstyle x_{1},\ldots ,x_{n}}$ der Länge ${\textstyle n}$
Daraus ermittelt man die absoluten Häufigkeiten $h(a_{k})=h_{k}={\text{Anzahl der}}\ j\ {\text{mit}}\ x_{j}=a_{k}\quad (k=1,\ldots ,m)$

Teststatistik und p-Wert

Teststatistik: ${\textstyle \quad T^{\ast }=\sum \limits _{k=1}^{m}{\frac {\left(h_{k}-n\cdot p_{k}\right)^{2}}{n\cdot p_{k}}}}$ (hohe Werte von ${\textstyle T}$ sprechen gegen ${\textstyle H_{0}}$ )
Idee: Falls ${\textstyle H_{0}}$ gilt, so erwartet man, dass ${\textstyle h_{k}}$ nahe bei ${\textstyle n\cdot p_{k}}$ ist (man bezeichnet ${\textstyle n\cdot p_{k}}$ auch als erwartete absolute Häufigkeit) und dass sich somit ein niedriger Wert für ${\textstyle T^{\ast }}$ ergibt. Folglich sprechen hohe Werte von ${\textstyle T^{\ast }}$ gegen ${\textstyle H_{0}}$ , niedrige Werte von ${\textstyle T^{\ast }}$ sind mit ${\textstyle H_{0}}$ vereinbar.

${\textstyle p}$ -Wert zu konkreter Teststatistik ${\textstyle T^{\ast }}$ : ${\textstyle \quad {\mathfrak {p}}^{\ast }=1-S_{m-1}\left(T^{\ast }\right)=}$ ${\textstyle \color {blue}{1-{\text{pchisq(}}T^{\ast },m-1)}}$
Dabei bezeichnet ${\textstyle S_{m-1}}$ die Verteilungsfunktion einer ${\textstyle \chi ^{2}}$ -Verteilung mit ${\textstyle m-1}$ FG.

Durchführung mit R

${\textstyle \quad \color {blue}{chisq.test(h,p=c(p_{1},\ldots ,p_{m}))}}$
Dabei müssen die beobachteten absoluten Häufigkeiten in einem Vektor h zusammengefasst sein.

Beispiel 1.1

Ein Würfel soll überprüft werden, ob er alle Augenzahlen mit der gleichen Wahrscheinlichkeit zeigt. Man betrachtet also die ZV ’Augenzahl’ ${\textstyle A}$ . Diese kann nur die Werte ${\textstyle a_{1}=1,\ldots ,a_{6}=6}$ annehmen. Zu prüfen ist, ob diesen Werten die Wahrscheinlichkeiten ${\textstyle p_{1}={\frac {1}{6}},\ldots ,p_{6}={\frac {1}{6}}}$ zugeordnet sind. Wir testen dazu die Nullhypothese $H_{0}:\ P\left(A=1\right)={\frac {1}{6}},\ P\left(A=2\right)={\frac {1}{6}},\ \ldots ,P\left(A=6\right)={\frac {1}{6}}$
Zur Überprüfung von ${\textstyle H_{0}}$ wird der Würfel ${\textstyle n=600}$ -mal geworfen. Es ergeben sich die folgenden (absoluten) Häufigkeiten der Augenzahlen:

${\begin{array}{|c|c|c|c|c|c|}\hline {\text{Augenzahl}}&1&2&3&4&5&6\\\hline {\text{absolute Häufigkeit}}&91&122&97&95&107&88\\\hline {\text{unter }}H_{0}{\text{ erwartete absolute Häufigkeit}}&100&100&100&100&100&100\\\hline \end{array}}$

Beispiel 1.2

(Kann man anhand dieser Beobachtungen davon ausgehen, dass bei diesem Würfel alle Augenzahlen mit der gleichen Wahrscheinlichkeit ${\textstyle {\frac {1}{6}}}$ auftreten?)

$p{\text{-Wert}}\;p^{\ast }=0.1607.$

Ausgehend davon, dass der Würfel tatsächlich alle Zahlen mit gleicher Wahrscheinlichkeit zeigt (dass also ${\textstyle H_{0}}$ gilt), ist die Wahrscheinlichkeit für die gefundenen (oder noch stärkere) Abweichungen der absoluten Häufigkeiten von den erwarteten absoluten Häufigkeiten (gemessen mit der Teststatistik ${\textstyle T}$ ) also ${\textstyle 16.07\%}$ und ist damit so groß, dass man ${\textstyle H_{0}}$ (zu üblichen Signifikanzniveaus) nicht ablehnen kann.

Beispiel 2

Ein Händler möchte wissen, ob die Verteilung seines Absatzes der Verteilung der Marken im Gesamtmarkt entspricht. Eine Untersuchung ergibt:

${\begin{array}{|c|c|c|c|c|c|c|c|}\hline {\text{Marke}}&1&2&3&4&5&6&7&8&{\text{Summe}}\\\hline {\text{(vermutete Wahrsch.)}}&0.35&0.19&0.17&0.11&0.06&0.06&0.04&0.02&1\\\hline {\text{(abs. Häuf.)}}&220&132&96&79&19&30&35&11&622\\\hline &217.70&118.18&105.74&68.42&37.32&37.32&24.88&12.44&622\\\hline \end{array}}$

$H_{0}:\ {\begin{array}{c}P(M=1)=0.35,\ P(M=2)=0.19,\ P(M=3)=0.17,\ P(M=4)=0.11,\\P(M=5)=0.06,\ P(M=6)=0.06,\ P(M=7)=0.04,\ P(M=8)=0.02\end{array}}$
${\textstyle p}$ -Wert ${\textstyle {\mathfrak {p}}^{\ast }=0.00855}$ .
Falls ${\textstyle H_{0}}$ gilt, ist die Wahrscheinlichkeit für das beobachtete Ergebnis (oder eines mit einer noch höheren Teststatistik) sehr gering, nämlich nur ${\textstyle 0.00855}$ . Dies spricht sehr stark gegen ${\textstyle H_{0}}$ . (Etwa zum Signifikanzniveau ${\textstyle \alpha =0.01}$ kann ${\textstyle H_{0}}$ abgelehnt werden.)

Anmerkungen 1

Erhält man bei einem ${\textstyle \chi ^{2}}$ -Anpassungstest ein signifikantes Ergebnis (kleiner p-Wert bzw. Ablehung von ${\textstyle H_{0}}$ ), so kann man schließen, dass (vermutlich) eine Abweichung von der in der Nullhypothese angegebenen Verteilung vorliegt. Der Test macht aber zunächst keine Aussage darüber, auf welche der einzelnen Wahrscheinlichkeiten sich diese Abweichung bezieht. (Die Daten geben jedoch Hinweise darauf.)

Anmerkungen 2

Der ${\textstyle \chi ^{2}}$ -Anpassungstest ist kein exakter Test. Das bedeutet, dass der p-Wert durch die oben angegebenen Formel näherungsweise (und nicht exakt) berechnet wird. Dieser Test sollte nur verwendet werden, wenn gewisse Mindestgrößen für die erwarteten absoluten Häufigkeiten vorliegen (dann sind die Näherungen gut genug). Als Faustregel findet man (unter anderem), dass alle ${\textstyle n\cdot p_{k}}$ größer oder gleich ${\textstyle 1}$ und mindestens 80% der ${\textstyle n\cdot p_{k}}$ größer oder gleich ${\textstyle 5}$ sein müssen.

Anmerkungen 3

Die Funktion chisq.test gibt eine Warnung aus, wenn nicht alle ${\textstyle n\cdot p_{k}}$ größer oder gleich ${\textstyle 5}$ sind. In diesem Fall sollte man also dem Testergebnis nicht zu sehr vertrauen (selbst bei einem signifikanten Ergebnis). Es bieten sich dann etwa folgende Möglichkeiten:

${\textstyle n}$ erhöhen und damit erreichen, dass ${\textstyle n\cdot p_{k}\geq 5}$ für alle ${\textstyle k=1,\ldots ,m}$ ist
mehrere Werte von ${\textstyle k}$ zusammenfassen, dies entspricht der Bildung von ’Klassen’ (s.u.), dabei gehen allerdings Teile der Informationen verloren
ein anderes (exaktes) Testverfahren benutzen

Aufgabe 1

An einer Uni gibt es die vier Fächer A, B, C und D. Insgesamt studieren ${\textstyle 44\%}$ der Studierenden Fach A, ${\textstyle 35\%}$ der Studierenden Fach B, ${\textstyle 13\%}$ der Studierenden Fach C und ${\textstyle 8\%}$ der Studierenden Fach D. An einem Sportkurs nehmen ${\textstyle 80}$ Studierende teil, davon ${\textstyle 28}$ mit Fach A, ${\textstyle 35}$ mit Fach B, ${\textstyle 14}$ mit Fach C und ${\textstyle 3}$ mit Fach D. Überprüfen Sie anhand dieser Daten die Nullhypothese, dass das Interesse an dem Sportkurs bei den Studierenden der verschiedenen Fächer gleich groß ist.

Aufgabe 2

Ein Tierbestand wird auf Präverenzen hinsichtlich der Aufenthaltswahrscheinlichkeit untersucht. Dazu wurde ein Gebiet in 6 unterschiedlich große Bereiche, in denen eine unterschiedliche Nahrungszusammensetzung für die Tiere gegeben sind, aufgeteilt und die Tiere in jedem der Bereiche gezählt. Man erhält:

${\begin{array}{|c|c|c|c|c|c|c|}\hline {\text{Bereich}}&1&2&3&4&5&6&{\text{Summe}}\\\hline {\text{Fläche in }}km^{2}&10&20&20&10&15&15&90\\\hline {\text{Anzahk Tiere }}&34&60&52&14&24&26&210\\\hline \end{array}}$

Untersuchen Sie, ob die Daten belegen, dass die Nahrungszusammensetzung dafür sorgt, dass sich die Tiere in manchen Bezirken grundsätzlich gerner aufhalten als in anderen.

Variante des Χ²-Anpassungstest für stetige Verteilungen:

Für eine ZV, bei der unendlich viele reelle Zahlen als Werte möglich sind, kann man auch einen ${\textstyle \chi ^{2}}$ -Anpassungstest verwenden. Man muss allerdings vorab den Bereich der möglichen Werte (recht willkürlich) in verschiedene Klassen ${\textstyle A_{1},\ldots ,A_{m}}$ unterteilen. Getestet werden können Nullhypothesen, die besagen, dass eine bestimmte (vollständig festgelegte) Verteilung vorliegt.

Voraussetzung und Hypothesenpaar

Voraussetzung: ${\textstyle X}$ eine beliebige (diskrete oder) stetige ZV

Hypothesenpaar: ${\textstyle \quad H_{0}:}$ ${\textstyle X}$ ist nach ${\textstyle {\mathcal {V}}}$ -verteilt ${\textstyle \quad H_{1}:}$ ${\textstyle X}$ ist nicht nach ${\textstyle {\mathcal {V}}}$ -verteilt
(Hierbei ist ${\textstyle {\mathcal {V}}}$ eine bestimmte (zu prüfende) Verteilung mit bestimmten vorgegebenen Parametern.)

Beispiel

Mögliche Nullhypothesen könnten sein:

${\textstyle \quad H_{0}:}$ ${\textstyle X}$ ist normalverteilt mit ${\textstyle \mu =120}$ und ${\textstyle \sigma =15}$
${\textstyle \quad H_{0}:}$ ${\textstyle X}$ ist exponentialverteilt mit ${\textstyle \lambda =0.0023}$

Vorüberlegung

Vorüberlegung: Man teilt (vor einem Blick auf die Daten) den Bereich der möglichen Werte von ${\textstyle X}$ in verschiedene (überschneidungsfreie) Klassen ${\textstyle A_{1},\ldots ,A_{m}}$ ein und berechnet für jede der Klassen ${\textstyle A_{k}}$ die sogenannte Klassenwahrscheinlichkeit ${\textstyle p_{k}=P(X\in A_{k})}$ , dass ${\textstyle X}$ einen Wert aus dieser Klasse annimmt, falls ${\textstyle H_{0}}$ gilt. (Dazu benötigt man theoretische Kenntnisse über die Verteilung ${\textstyle {\mathcal {V}}}$ und verwendet Methoden aus der Wahrscheinlichkeitsrechnung, siehe Kapitel 4.)

Vorliegende Daten und Teststatistik

Vorliegende Daten: Stichprobe ${\textstyle x_{1},\ldots ,x_{n}}$ der Länge ${\textstyle n}$
Daraus ermittelt man die absoluten Klassenhäufigkeiten $h(a_{k})=h_{k}={\text{Anzahl der}}\ j\ {\text{mit}}\ x_{j}\in A_{k}\quad (k=1,\ldots ,m)$

Teststatistik: ${\textstyle \quad T^{\ast }=\sum \limits _{k=1}^{m}{\frac {\left(h_{k}-n\cdot p_{k}\right)^{2}}{n\cdot p_{k}}}}$ (hohe Werte von ${\textstyle T}$ sprechen gegen ${\textstyle H_{0}}$ )

${\textstyle p}$ -Wert zu konkreter Teststatistik ${\textstyle T^{\ast }}$ : ${\textstyle \quad {\mathfrak {p}}^{\ast }=1-S_{m-1}\left(T^{\ast }\right)=}$ ${\textstyle \color {blue}{1-{\text{pchisq(}}T^{\ast },m-1)}}$
Dabei bezeichnet ${\textstyle S_{m-1}}$ die Verteilungsfunktion einer ${\textstyle \chi ^{2}}$ -Verteilung mit ${\textstyle m-1}$ FG.

Beispiel 1.1

Man möchte testen, ob eine ZV normalverteilt mit ${\textstyle \mu =100}$ und ${\textstyle \sigma =20}$ sein könnte und betrachtet dazu die Nullhypothese: ${\textstyle \quad H_{0}:}$ ${\textstyle X}$ ist normalverteilt mit ${\textstyle \mu =100}$ und ${\textstyle \sigma =20}$
Der Bereich der möglichen Werte (also ${\textstyle ]-\infty ,\infty [}$ ) wird wie folgt in Klassen eingeteilt: $A_{1}=]-\infty ,80[,\quad A_{2}=[80,92[,\quad A_{3}=[92,100[,\quad$
$A_{4}=[100,108[,\quad A_{5}=[108,120[,\quad A_{6}=[120,\infty [$
Die Klassenwahrscheinlichkeiten berechnen sich nun wie folgt (vergleiche Normalverteilte ZV ):

Beispiel 1.2

${\begin{aligned}p_{1}&=&P(X\in A_{1})=0.1587\\p_{2}&=&P(X\in A_{2})=0.1859\\p_{3}&=&P(X\in A_{3})=0.1554\\p_{4}&=&P(X\in A_{4})=0.1554\\p_{5}&=&P(X\in A_{5})=0.1859\\p_{6}&=&P(X\in A_{6})=0.1587\end{aligned}}$

Beispiel 1.3

Nun wird die folgende Stichprobe ermittelt ( ${\textstyle n=80}$ ):

104.0, 98.6, 125.4, 127.1, 125.4, 70.9, 96.1, 80.6, 92.3, 97.3, 73.4, 102.7, 134.5, 87.4,
120.1, 95.0, 89.7, 116.1, 119.1, 107.6, 103.8, 99.3, 138.7, 60.8, 77.5, 93.3, 95.9, 89.3,
146.2, 73.5, 100.5, 104.7, 47.7, 93.1, 113.6, 89.0, 122.5, 51.0, 88.0, 99.6, 98.3, 98.2,
86.1, 115.1, 103.4, 73.8, 77.2, 118.2, 78.9, 130.7, 112.5, 88.5, 115.8, 116.3, 107.7, 118.3,
128.7, 114.9, 95.7, 131.1, 111.0, 72.1, 113.3, 84.4, 82.6, 86.6, 106.2, 148.0, 110.3, 108.5,
96.7, 125.6, 71.1, 97.0, 114.9, 56.8, 74.3, 98.9, 104.9, 122.0

${\textstyle p}$ -Wert ${\textstyle {\mathfrak {p}}^{\ast }=0.7341}$ .
Die Daten sind also mit der Nullhypothese vereinbar. (Es liegt kein signifikantes Ergebnis vor.)

Anmerkungen 1

Die Wahl der Klassen kann das Testergebnis beeinflussen. Daher müssen die Klassen schon vor der Datenerhebung festgelegt werden. Darüber hinaus gibt es keine festen Regeln für die Einteilung der Klassen. Es macht meist Sinn, die Klassen als Intervalle zu wählen und darauf zu achten, dass die unter ${\textstyle H_{0}}$ erwarteten Klassenhäufigkeiten in etwa gleich groß und allesamt größer oder gleich ${\textstyle 5}$ sind. Auf jeden Fall sollte man vor der Durchführung eines Tests sorgfältig über die Wahl der Klassen nachdenken.

Anmerkungen 2

Bei dem angegebenen Verfahren wird das Testergebnis durch die exakten Werte der Stichprobe nicht beeinflusst, lediglich die Klassenhäufigkeiten sind von Bedeutung (Teile der vorhanden Informationen werden nicht genutzt). Genau genommen entspricht dies nicht einem Test der Nullhypothese
${\textstyle H_{0}:}$ ${\textstyle X}$ ist nach ${\textstyle {\mathcal {V}}}$ verteilt ${\textstyle \quad }$ ( ${\textstyle {\mathcal {V}}}$ bezeichne eine bestimmte Verteilung)
sondern von
${\textstyle H_{0}:}$ ${\textstyle P(X\in A_{k})=P\left({\text{eine nach}}\ {\mathcal {V}}\ {\text{verteilte}}\ {\text{ZV liegt in}}\ A_{k}\right)}$
$\quad {\text{für alle}}\ k=1,\ldots ,m$

Anmerkungen 3

Damit kann der Test Abweichungen von der hypothetischen Verteilung ${\textstyle {\mathcal {V}}}$ , die die Klassenwahrscheinlichkeiten nicht beeinflussen, nicht aufdecken.

Variante des Χ²-Anpassungstest zum Testen auf die Art der Verteilung:

Will man lediglich testen, dass eine bestimmte Verteilungsart vorliegt, so kann man den oder die unbekannten Parameter schätzen und dann einen Anpassungstest wie oben durchführen. In diesem Fall verringert sich die Zahl der Freiheitsgrade um die Anzahl der geschätzten Parameter, man benutzt also die ${\textstyle \chi ^{2}}$ -Verteilung ${\textstyle S_{m-g-1}}$ , wobei ${\textstyle m}$ die Zahl der Klassen und ${\textstyle g}$ die Zahl der geschätzten Parameter ist.

Beispiel 1.1

Es soll überprüft werden, ob die ’Lebensdauer’ ${\textstyle X}$ von Seifenblasen (in Sekunden) exponentialverteilt ist (das hieße, die Wahrscheinlichkeit, dass eine Blase im kommenden Zeitraum platzt, ändert sich nicht, wenn die Blase eine Zeitlang ’überlebt’ hat). Man formuliert dazu die Nullhypothese
${\textstyle H_{0}:}$ ${\textstyle X}$ ist exponentialverteilt (mit irgendeinem Parameter ${\textstyle \lambda }$ )
und legt die Klassen wie folgt fest: $A_{1}=[0,6[,\quad A_{2}=[6,10[,\quad A_{3}=[10,15[,\quad A_{4}=[15,\infty [$ Zur Berechnung der Klassenwahrscheinlichkeiten unter ${\textstyle H_{0}}$ (und damit der erwarteten Klassenhäufigkeiten) muss der Parameter ${\textstyle \lambda }$ geschätzt werden.

Beispiel 1.2

Man testet nun ${\textstyle n=40}$ Seifenblasen und bestimmt die folgenden Zeiten bis zum Zerplatzen: 16.2 , 7.5 , 13.0 , 7.4, 13.8 , 6.0 , 52.8 , 6.7, 35.1 , 6.5 , 3.5 , 8.1, 15.2 , 14.0 , 47.0, 2.7 , 10.4 , 11.5 ,
24.8 , 5.6 , 34.1, 17.2 , 19.3 , 13.6, 12.9 , 12.7, 25.6, 24.3 , 0.4 , 10.8, 28.1, 25.2 , 11.6, 5.2 , 4.5 , 3.7,
4.2 , 7.9, 6.9 , 25.8

Die Zahl der Freiheitsgrade für die ${\textstyle \chi ^{2}}$ -Verteilung ergibt sich als
${\text{Zahl der Klassen}}-{\text{Zahl der geschätzten Parameter}}-1=$
$\ 4-1-1=2$
und somit ergibt sich der ${\textstyle p}$ -Wert als ${\textstyle \quad {\mathfrak {p}}^{\ast }=0.0626}$

Aufgabe

An einer Kreuzung wird mehrfach die Zeit zwischen zwei Unfällen festgestellt. Es ergeben sich die folgenden Daten (gemessen in Tagen): $12,\quad 2,\quad 62,\quad 31,\quad 89,\quad 6,\quad 32,\quad 12,\quad 5,\quad 177.$
Führen Sie einen ${\textstyle \chi ^{2}}$ -Anpassungstest erst für vermutete (aufgrund theoretischer Üerlegungen) und dann für geschätze Paramter durch. Wählen Sie die Klassengrenzen und ${\textstyle \alpha }$ selbst.
Anmerkung: Diese Aufgabe ist bewusst sehr offen gestellt - entscheiden Sie selbst!

Χ²-Homogenitätstest:

Mit einem ${\textstyle \chi ^{2}}$ -Homogenitätstest kann für zwei diskrete oder stetige ZV getestet werden, ob sie diesselbe Verteilung haben könnten.

Χ²-Homogenitätstest für diskrete Verteilungen

Voraussetzung und Hypothesenpaar

Voraussetzung: ${\textstyle X,Y}$ diskrete ZV mit denselben möglichen Werten ${\textstyle a_{1},\ldots ,a_{m}}$

Hypothesenpaar: $H_{0}:\ P\left(X=a_{1}\right)=P(Y=a_{1})\ ,\ldots \ ,\ P\left(X=a_{m}\right)=P(Y=a_{m})$ $H_{1}:P(X=a_{k})\not =P(Y=a_{k})\ {\text{für mindestens ein}}\ k\in \{1,\ldots ,m\}$

oder

$H_{0}:X\;{\text{und}}\;Y{\text{ haben diesselbe Verteilung}}$
$H_{1}:{\text{Die Verteilungen von}}\;X\;{\text{und}}\;Y{\text{ unterscheiden sich.}}$

Vorliegende Daten

Vorliegende Daten: Unabhängige Stichproben ${\textstyle x_{1},\ldots ,x_{\left(h^{(X)}\right)}\ {\text{von}}\ X\quad {\text{und}}\quad y_{1},\ldots ,y_{\left(h^{(Y)}\right)}\ {\text{von}}\ Y}$
Daraus ermittelt man die absoluten Häufigkeiten ${\begin{array}{l}h^{(X)}(a_{k})=h_{k}^{(X)}={\text{Anzahl der}}\ j\in \{1,\ldots ,h^{(X)}\}\ {\text{mit}}\ x_{j}=a_{k}\\h^{(Y)}(a_{k})=h_{k}^{(Y)}={\text{Anzahl der}}\ j\in \{1,\ldots ,h^{(Y)}\}\ {\text{mit}}\ y_{j}=a_{k}\end{array}}$
für ${\textstyle k=1,\ldots ,m}$ . Oft fasst man diese in einer sogenannten Kontingenztabelle zusammen, dabei entspricht $h^{(X)}$ der absoluten Häufigkeit aller Ausprägungen der Stichprobe von $X$ , was gerade die Stichprobenlänge von $X$ ist:
${\begin{array}{|c|c|c|c|}\hline &a_{1}&a_{2}&\ldots &a_{m}&{\text{gesamt}}\\\hline X&h_{1}^{(X)}&h_{2}^{(X)}&\ldots &h_{m}^{(X)}&h^{(X)}\\\hline Y&h_{1}^{(Y)}&h_{2}^{(Y)}&\ldots &h_{m}^{(Y)}&h^{(Y)}\\\hline {\text{gesamt}}&h_{1}=h_{1}^{(X)}+h_{1}^{(Y)}&h_{2}=h_{2}^{(X)}+h_{2}^{(Y)}&\ldots &h_{m}=h_{m}^{(X)}+h_{m}^{(Y)}&n=h^{(X)}+h^{(Y)}\\\hline \end{array}}$

Teststatistik

Teststatistik: ${\textstyle \quad T^{\ast }=\sum \limits _{k=1}^{m}{\frac {\left(h_{k}^{(X)}-h^{(X)}{\frac {h_{k}}{n}}\right)^{2}}{h^{(X)}{\frac {h_{k}}{n}}}}\ +\ \sum \limits _{k=1}^{m}{\frac {\left(h_{k}^{(Y)}-h^{(Y)}{\frac {h_{k}}{n}}\right)^{2}}{h^{(Y)}{\frac {h_{k}}{n}}}}=\sum \limits _{i\in {X,Y}}\sum \limits _{k=1}^{m}{\frac {\left(h_{k}^{(i)}-h^{(i)}{\frac {h_{k}}{n}}\right)^{2}}{h^{(i)}{\frac {h_{k}}{n}}}}}$
(hohe Werte von ${\textstyle T}$ sprechen gegen ${\textstyle H_{0}}$ )
Idee: Die Idee dabei ist, dass man im Falle der Gültigkeit von ${\textstyle H_{0}}$ annehmen kann, dass die relativen Häufigkeiten von ${\textstyle a_{k}}$ bei ${\textstyle X}$ und ${\textstyle Y}$ nahe bei der gesamten relativen Häufigkeit von ${\textstyle a_{k}}$ sind, das heißt dass ${\frac {h_{k}^{(X)}}{h^{(X)}}}\sim {\frac {h_{k}}{n}}\quad {\text{und}}\quad {\frac {h_{k}^{(Y)}}{h^{(Y)}}}\sim {\frac {h_{k}}{n}}$
zu erwarten ist, wenn ${\textstyle H_{0}}$ gilt. Dies hätte dann zur Folge, dass die bei der Berechnung von ${\textstyle T^{\ast }}$ auftretenden Quadrate (und damit auch ${\textstyle T^{\ast }}$ selbst) eher kleine Werte annimmt, wenn ${\textstyle H_{0}}$ gilt. Also spricht ein hoher Wert von ${\textstyle T^{\ast }}$ gegen ${\textstyle H_{0}}$ .

p-Wert

${\textstyle p}$ -Wert zu konkreter Teststatistik ${\textstyle T^{\ast }}$ : ${\textstyle \quad {\mathfrak {p}}^{\ast }=1-S_{m-1}\left(T^{\ast }\right)=}$ ${\textstyle \color {blue}{1-{\text{pchisq(}}T^{\ast },m-1)}}$
Dabei bezeichnet ${\textstyle S_{m-1}}$ die Verteilungsfunktion einer ${\textstyle \chi ^{2}}$ -Verteilung mit ${\textstyle m-1}$ FG.

Durchführung mit R

Man kann diesen Test in R mit chisq.test(h) durchführen. Dabei muss ${\textstyle h}$ eine Matrix (mit 2 Zeilen und ${\textstyle m}$ Spalten) sein, deren Einträge mit denen der Kontingenztabelle übereinstimmen (d.h. in der ersten Zeile von ${\textstyle h}$ befinden sich die Werte ${\textstyle h_{1}^{(X)},\ldots ,h_{m}^{(X)}}$ und in der zweiten Zeile die Werte ${\textstyle h_{1}^{(Y)},\ldots ,h_{m}^{(Y)}}$ .)
Man erreicht dies zum Beispiel mit: $\color {blue}{h<{\text{-matrix(c(}}h_{1}^{(X)},\ldots ,h_{m}^{(X)},h_{1}^{(Y)},\ldots ,h_{m}^{(Y)}{\text{),nrow=2,ncol=m,byrow=TRUE)}}}$

Beispiel 1.1

Es soll untersucht werden, ob Frauen und Männer das gleiche Wahlverhalten zeigen. Zu den 5 zur Auswahl stehenden Parteien wurden 120 Frauen und 100 Männer befragt. Es ergab sich folgende Kontingenztabelle:
${\begin{array}{|c||c|c|c|c|c|c|}\hline &{\text{Partei 1}}&{\text{Partei 2}}&{\text{Partei 3}}&{\text{Partei 4}}&{\text{Partei 5}}&{\text{gesamt}}\\\hline \hline {\text{Frauen}}&h_{1}^{(X)}=50&h_{2}^{(X)}=34&h_{3}^{(X)}=9&h_{4}^{(X)}=18&h_{5}^{(X)}=9&h^{(X)}=120\\\hline {\text{Männer}}&h_{1}^{(Y)}=31&h_{2}^{(Y)}=26&h_{3}^{(Y)}=21&h_{4}^{(Y)}=12&h_{5}^{(Y)}=10&h^{(Y)}=100\\\hline {\text{gesamt}}&h_{1}=81&h_{2}=60&h_{3}=30&h_{4}=30&h_{5}=19&n=220\\\hline \end{array}}$

Beispiel 1.2

Man berechnet nun die Teststatistik und den ${\textstyle p}$ -Wert ${\textstyle {\mathfrak {p}}^{\ast }=0.0432}$ . Dies ist also ein signifikantes Ergebnis (zum Signifikanzniveau ${\textstyle \alpha =0.05}$ ) und damit ist die Gegenhypothese
$H_{1}:{\text{ Männer und Frauen wählen unterschiedlich.}}$
mit den Daten vereinbar.

Anmerkungen I

Falls ${\textstyle X}$ und ${\textstyle Y}$ stetige ZV sind, kann man den ${\textstyle \chi ^{2}}$ -Homogenitätstest immer noch durchführen, wenn man die Menge der möglichen Werte der beiden ZV vor der Datenerhebung in Klassen ${\textstyle A_{1},\ldots ,A_{m}}$ aufteilt und dann die absoluten Klassenhäufigkeiten $h_{k}^{(X)}={\text{Anzahl der}}\ j\in \{1,\ldots ,h^{(X)}\}\ {\text{mit}}\ x_{j}\in A_{k}\quad {\text{und}}$
$\quad h_{k}^{(Y)}={\text{Anzahl der}}\ j\in \{1,\ldots ,h^{(Y)}\}\ {\text{mit}}\ y_{j}\in A_{k}$
für ${\textstyle k=1,\ldots ,m}$ in die Kontingenztabelle einträgt.

Anmerkungen II

Man beachte dabei, dass die Wahl der Klassen das Testergebnis beeinflussen kann und dass der Test bestimmte Unterschiede in den Verteilungen von ${\textstyle X}$ und ${\textstyle Y}$ nicht mehr aufdecken kann, genau genommen untersucht man nun statt der Nullhypothese $H_{0}:\ X\;{\text{und}}\;Y\;{\text{haben dieselbe Verteilung}}$
die veränderte Nullhypothese $H_{0}:\ P(X\in A_{k})=P(Y\in A_{k})\quad {\text{für alle}}\ k=1,\ldots ,m$

Beispiel 1.1

Zwei Maschinen ${\textstyle X}$ und ${\textstyle Y}$ sollen Kaffee in Päckchen mit je 500 g abfüllen. Es soll festgestellt werden, ob beide Maschinen gleich arbeiten, dazu sollen 60 Päckchen von ${\textstyle X}$ und 40 Päckchen von ${\textstyle Y}$ untersucht werden. Man bildet (zum Beispiel) die folgenden Klassen $A_{1}=[0,496[,\quad A_{2}=[496,498[,\quad A_{3}=[498,499[,\quad A_{4}=[499,500[,$ $A_{5}=[500,501[,\quad A_{6}=[501,502[,\quad A_{7}=[502,504[,\quad A_{8}=[504,\infty [$ und betrachtet dann die Stichproben. Es ergeben sich die folgenden Werte für die Gewichte der einzelnen Päckchen:

Beispiel 1.2

${\text{Für}}\ X:502.16,\ 498.67,\ 499.66,\ 499.71,\ 497.53,\ 499.28,\ 499.47,\ 499.42,\ 499.72,\ 500.25,$
$502.77,\ 501.59,\ 501.65,\ 502.12,\ 496.87,\ 501.37,\ 499.03,\ 494.84,\ 500.33,\ 500.02,$
$497.19,\ 498.35,\ 502.10,\ 501.12,\ 497.78,\ 501.85,\ 498.44,\ 498.80,\ 501.14,\ 501.90,$
$500.44,\ 499.73,\ 501.73,\ 499.16,\ 498.91,\ 500.91,\ 503.25,\ 499.45,\ 502.89,\ 498.39,$
$498.66,\ 502.23,\ 499.31,\ 500.63,\ 501.31,\ 499.94,\ 504.43,\ 496.44,\ 500.84,\ 504.07,$
$502.06,\ 495.90,\ 502.77,\ 498.20,\ 497.09,\ 499.81,\ 501.17,\ 503.97,\ 498.50,\ 499.67$

${\text{Für}}\ Y:491.33,\ 491.67,\ 493.52,\ 494.81,\ 495.42,\ 495.76,\ 496.43,\ 496.67,\ 497.88,\ 498.72,$
$499.19,\ 499.21,\ 499.33,\ 499.36,\ 499.38,\ 499.40,\ 499.61,\ 499.63,\ 500.21,\ 500.30,$
$500.43,\ 500.90,\ 500.92,\ 500.99,\ 501.28,\ 501.49,\ 501.50,\ 501.78,\ 502.41,\ 502.65,$
$503.02,\ 503.07,\ 503.56,\ 503.84,\ 504.00,\ 504.19,\ 504.82,\ 505.12,\ 505.21,\ 507.54$

$\quad p{\text{-Wert:}}\ {\mathfrak {p}}^{\ast }=1-S_{8-1}(T^{\ast })=0.0671$
Die Nullhypothese: ${\textstyle H_{0}}$ : ${\textstyle X\;}$ und ${\textstyle Y}$ sind identisch verteilt. kann also zum Signifikanzniveau ${\textstyle \alpha =0.1}$ abgelehnt werden, nicht jedoch für ${\textstyle \alpha =0.05}$ .

Beispiel 1.3

Ein zweiseitiger Zwei-Stichproben- ${\textstyle t}$ -Test (Welch-Test) zur Nullhypothese
${\textstyle H_{0}:\mu _{X}=\mu _{Y}}$

liefert einen ${\textstyle p}$ -Wert von ${\textstyle 0.9411}$ . (Die empirischen Mittelwerte ${\textstyle {\overline {X}}=500.1165}$ und ${\textstyle {\overline {Y}}=500.1637}$ unterscheiden sich auch nicht sehr stark.) Der Unterschied zwischen den beiden Verteilungen scheint also eher nicht an ihren Erwartungswerten zu liegen.

Anwendbarkeit

Da die Teststatistik nur approximativ ${\textstyle \chi ^{2}}$ -verteilt ist, kann der Test nur angewendet werden, wenn die unter ${\textstyle H_{0}}$ erwarteten absoluten Häufigkeiten ${\textstyle h^{(X)}\cdot {\frac {h_{k}}{n}}}$ und ${\textstyle h^{(Y)}\cdot {\frac {h_{k}}{n}}}$ groß genug sind (Regel: alle ${\textstyle \geq 1}$ und mindestens 80% davon ${\textstyle \geq 5}$ ). Sind sie nicht alle ${\textstyle \geq 5}$ , so erhält man bei Anwendung der Funktion chisq.test eine Warnung.

Aufgabe 1

In einer Studie soll auf Unterschiede in zwei Habitaten $X$ und $Y$ in Bezug auf die Zusammensetzung der Ameisenpopulation untersucht werden. Dazu wird in beiden Habitaten eine Falle aufgestellt und die Anzahl der darin gefangenen Individuen der jeweiligen Ameisenarten gezählt:

${\begin{array}{|c|c|c|c|}\hline {\text{Ameisenart}}&A&B&C&D\\\hline {\text{Anzahl in Habitat X}}&513&212&190&364\\\hline {\text{Anzahl in Habitat Y}}&236&93&105&196\\\hline \end{array}}$

Untersuchen Sie mit einem ${\textstyle \chi ^{2}}$ - Homogenitätstest, ob die Habitate einen Einfluss auf die Zusammensetzung der Ameisenpopulationen haben.

Aufgabe 2

Kuss et al. (The fouled player should not take the penalty himself: An empirical investigation of an old German football myth, J. Sports Sciences 25, no. 9, 963967, 2007) berichten über die Elfmeter in der 1. Fußballbundesliga (der Herren) von August 1993 bis Februar 1995. Es wurde festgestellt, dass von 92 Elfmetern, bei denen der Gefoulte selbst geschossen hatte, 74 verwandelt wurden. Von 733 Elfmetern, bei denen der Gefoulte nicht selbst geschossen hatte, wurden 547 verwandelt. Stützen diese Daten die These, dass der Gefoulte den Elfmeter nicht selbst schießen sollte ?

Aufgabe 3

Betrachten Sie erneut die beiden Abfüllanlagen für Kaffee mit den ZV ${\textstyle X}$ und ${\textstyle Y}$ . Prüfen Sie erneut mit vier Klassen, ob die gleiche Verteilung vor liegt. Verwenden Sie die Daten aus dem R-Skript datenUEB10.r von GitHub.

Verfahren für mehrere ZV 1

Das Verfahren lässt sich leicht für drei oder mehr ZV ${\textstyle X^{(1)},\ldots ,X^{(l)}}$ verallgemeinern. Liegen Stichproben vor, anhand derer man eine Kontingenztabelle
${\begin{array}{|c|c|c|c|}\hline &a_{1}&a_{2}&\ldots &a_{m}&{\text{gesamt}}\\\hline X^{(1)}&h_{1}^{(1)}&h_{2}^{(1)}&\ldots &h_{m}^{(1)}&h^{(1)}\\\hline X^{(2)}&h_{1}^{(2)}&h_{2}^{(2)}&\ldots &h_{m}^{(2)}&h^{(2)}\\\hline \vdots &\vdots &\vdots &\ddots &\vdots &\vdots \\\hline X^{(l)}&h_{1}^{(l)}&h_{2}^{(l)}&\ldots &h_{m}^{(l)}&h^{(l)}\\\hline {\text{gesamt}}&h_{1}&h_{2}&\ldots &h_{m}&n\\\hline \end{array}}$

aufstellen kann, so testet man die Nullhypothese
$H_{0}:{\text{ Die }}ZV\;X^{(1)},\ldots X^{(l)}{\text{ haben alle die gleiche Verteilung.}}$

Verfahren für mehrere ZV 2

mit der Teststatistik
$T^{\ast }=\sum \limits _{i=1}^{l}\sum \limits _{k=1}^{m}{\frac {\left(h_{k}^{(i)}-h^{(i)}\cdot {\frac {h_{k}}{n}}\right)^{2}}{h^{(i)}\cdot {\frac {h_{k}}{n}}}}$

Diese ist ${\textstyle \chi ^{2}}$ -verteilt mit ${\textstyle (m-1)\cdot (l-1)}$ Freiheitsgraden, man berechnet den ${\textstyle p}$ -Wert durch ${\textstyle 1-S_{(m-1)\cdot (l-1)}(T^{\ast })}$ .

Man kann dies in R (wie im Fall ${\textstyle l=2}$ , siehe oben) mit chisq.test( ${\textstyle h}$ ) tun, wobei die Matrix ${\textstyle h}$ , die der Kontingenztabelle entspricht, diesmal eine Matrix mit ${\textstyle l}$ Zeilen und ${\textstyle m}$ Spalten sein muss.

Aufgabe

An drei Schulen wird eine Vergleichsarbeit geschrieben. Dabei ergeben sich die folgenden Notenspiegel:
${\begin{array}{|c|c|c|c|}\hline {\text{Note}}&1&2&3&4&5&6\\\hline {\text{Anzahl Schüler in Schule 1}}&7&11&20&17&7&1\\\hline {\text{Anzahl Schüler in Schule 2}}&4&17&30&17&5&1\\\hline {\text{Anzahl Schüler in Schule 3}}&7&19&24&7&6&3\\\hline \end{array}}$

Untersuchen Sie mit einem ${\textstyle \chi ^{2}}$ - Homogenitätstest, ob diese Daten belegen, dass es an den Schulen signifikante Unterschiede bezüglich der Wahrscheinlichkeitsverteilung für die verschiedenen Noten gibt.

Χ²-Unabhängigkeitstest für diskrete oder stetige Verteilungen

Mit einem ${\textstyle \chi ^{2}}$ -Unabhängigkeitstest kann für zwei diskrete oder stetige ZV anhand verbundener Stichproben getestet werden, ob sie unabhängig voneinander sein könnten.
(Mathematisch unterscheidet sich diese Variante nicht von dem zuvor behandelten Homogenitätstest für zwei oder mehr unabhängige ZV. In Bezug auf Anwendungsbezug, Formulierung und Interpretation bestehen aber Unterschiede, die wir hier behandeln wollen.)

Voraussetzung und Hypothesenpaar

Voraussetzung:
${\textstyle X}$ diskrete oder stetige ZV mit den möglichen Werten ${\textstyle a_{1},\ldots ,a_{m}}$ oder den Klassen ${\textstyle A_{1},\ldots ,A_{m}}$
${\textstyle Y}$ diskrete oder stetige ZV mit den möglichen Werten ${\textstyle b^{(1)},\ldots ,b^{(l)}}$ oder den Klassen ${\textstyle B_{1},\ldots ,B_{l}}$
Hypothesenpaar: $H_{0}:X\;{\text{und}}\;Y\;{\text{sind unabhängig voneinander }}\quad$ $H_{1}:X\;{\text{und}}\;Y\;{\text{sind nicht unabhängig voneinander}}$

Vorliegende Daten

Vorliegende Daten: Verbundene Stichproben ${\textstyle (x_{1},y_{1})\ldots ,(x_{n},y_{n})\ {\text{von}}\ X\ {\text{und}}\ Y}$

Daraus bestimmt man die gemeinsamen absoluten Häufigkeiten
$h_{k}^{(i)}={\text{Anzahl der}}\ j\ {\text{mit }}x_{j}=a_{k}({\text{ bzw. }}x_{j}\in A_{k})\ {\text{und}}$ $\ y_{j}=b^{(i)}({\text{ bzw. }}y_{j}\in B_{i}){\text{ für }}(k=1,\ldots ,m,\ i=1,\ldots ,l)$
und trägt sie in eine Kontingenztabelle ein:
${\begin{array}{|c|c|c|c|}\hline &a_{1}&a_{2}&\ldots &a_{m}&{\text{gesamt}}\\\hline b^{(1)}&h_{1}^{(1)}&h_{2}^{(1)}&\ldots &m_{k}^{(1)}&h^{(1)}=\sum \limits _{k=1}^{m}h_{k}^{(1)}\\\hline b^{(2)}&h_{1}^{(2)}&h_{2}^{(2)}&\ldots &h_{m}^{(2)}&h^{(2)}=\sum \limits _{k=1}^{m}h_{k}^{(2)}\\\hline \vdots &\vdots &\vdots &\ddots &\vdots &\vdots \\\hline b^{(l)}&h_{1}^{(l)}&h_{2}^{(l)}&\ldots &h_{m}^{(l)}&h^{(l)}=\sum \limits _{k=1}^{m}h_{k}^{(l)}\\\hline {\text{gesamt}}&h_{1}=\sum \limits _{i=1}^{l}h_{1}^{(i)}&h_{2}=\sum \limits _{i=1}^{l}h_{2}^{(i)}&\ldots &h_{m}=\sum \limits _{i=1}^{l}h_{m}^{(i)}&n\\\hline \end{array}}$

Teststatistik

Teststatistik: ${\textstyle \quad T^{\ast }=\sum \limits _{i=1}^{l}\sum \limits _{k=1}^{m}{\frac {\left(h_{k}^{(i)}-h_{k}\cdot {\frac {h^{(i)}}{n}}\right)^{2}}{h_{k}\cdot {\frac {h^{(i)}}{n}}}}\quad }$ (hohe Werte von ${\textstyle T}$ sprechen gegen ${\textstyle H_{0}}$ )
Idee: Falls ${\textstyle H_{0}}$ gilt, erwartet man, dass die entsprechende Tabelle der relativen Häufigkeiten mit hoher Wahrscheinlichkeit in etwa eine Multiplikationstabelle ist, d.h. dass
${\frac {h_{k}^{(i)}}{n}}\sim {\frac {h_{k}}{n}}\cdot {\frac {h^{(i)}}{n}}\quad \Leftrightarrow \quad h_{k}^{(i)}\sim {\frac {h_{k}\cdot h^{(i)}}{n}}$
für alle auftretenden Paare ${\textstyle (k,i)}$ gilt. (Man schreibt manchmal auch ${\textstyle {\tilde {h}}_{k}^{(i)}={\frac {h_{k}\cdot h^{(i)}}{n}}}$ und nennt dies die unter ${\textstyle H_{0}}$ erwartete absolute Häufigkeit von ${\textstyle a_{k}}$ für ${\textstyle X}$ und ${\textstyle b^{(i)}}$ für ${\textstyle Y}$ .)

p-Wert

${\textstyle p}$ -Wert zu konkreter Teststatistik ${\textstyle T^{\ast }}$ :
${\textstyle \quad {\mathfrak {p}}^{\ast }=1-S_{(m-1)\cdot (l-1)}(T^{\ast })=\color {blue}{1-{\text{pchisq(}}T^{\ast },(m-1)*(l-1))}}$
Dabei bezeichnet ${\textstyle S_{m-1}}$ die Verteilungsfunktion einer ${\textstyle \chi ^{2}}$ -Verteilung mit ${\textstyle m-1}$ FG.

Durchführung mit R

Dies geht völlig analog zum Fall der Homogenitätshypothese (siehe oben) mit ${\textstyle \color {blue}{chisq.test(h)}}$ , falls ${\textstyle h}$ die Matrix entsprechend der Kontingenztabelle ( ${\textstyle l}$ Zeilen, ${\textstyle m}$ Spalten) ist.

Beispiel 1.1

In einem Leichtathletikverein werden die Leistungen im Kugelstoßen und im 100 Meter-Lauf untersucht. Man teilt die möglichen Zeiten und Weiten in Klassen ein, erfasst die Leistungen von ${\textstyle n=100}$ Sportlern und stellt die absoluten Klassenhäufigkeiten in der Kontingenzabelle zusammen:
${\begin{array}{|c|c|c|c|}\hline &{\text{Kugelstoßen}}&&&\\\hline {\text{100m-Lauf}}&A_{1}=[0,8[&A_{2}=[8,12[&A_{3}=[12,\infty [&{\text{gesamt}}\\\hline B_{1}=[0,11[&h_{1}^{(1)}=3&h_{2}^{(1)}=6&h_{3}^{(1)}=1&h^{(1)}=10\\\hline B_{2}=[11,11.5[&h_{1}^{(2)}=4&h_{2}^{(2)}=8&h_{3}^{(2)}=7&h^{(2)}=19\\\hline B_{3}=[11.5,12.5[&h_{1}^{(3)}=15&h_{2}^{(3)}=22&h_{3}^{(3)}=12&h^{(3)}=49\\\hline B_{4}=[12.5,\infty [&h_{1}^{(4)}=6&h_{2}^{(4)}=11&h_{3}^{(4)}=5&h^{(4)}=22\\\hline {\text{gesamt}}&h_{1}=28&h_{2}=47&h_{3}=25&n=100\\\hline \end{array}}$

Beispiel 1.2

Also ergibt sich der ${\textstyle p}$ -Wert zur Unabhängigkeitshypothese als ${\textstyle {\mathfrak {p}}^{\ast }=0.8055}$ und damit kann sie nicht abgelehnt werden. Allerdings sind hier einige (3 von 12) erwartete absolute Häufigkeiten kleiner als 5 und damit ist die Approximation der Verteilung von ${\textstyle T}$ durch die ${\textstyle \chi ^{2}}$ -Verteilung möglicherweise zu ungenau.

Abschließende Bemerkungen zu den Χ²-Tests

Zum Abschluss dieses Abschnitts noch einige Anmerkungen zu Vor- und Nachteilen von ${\textstyle \chi ^{2}}$ -Tests.

Vorteile:

Die Tests sind vielseitig einsetzbar (viele verschiedenartige Nullhypothesen können damit getestet werden).
Die Idee ist (relativ) leicht verständlich.
Die Tests sind verteilungsfrei, d.h. es muss nicht vorausgesetzt werden, dass eine bestimmte Verteilungsart vorliegt. Insbesondere bei diskreten Verteilungen werden diese Tests daher oft verwendet.
R (und andere Statistik-Software-Pakete) haben die Tests implementiert.

Nachteile 1

Bei stetigen ZV beeinflusst die (willkürliche) Bildung der Klassen das Testergebnis. Diese kann auch dazu führen, dass bestimmte Abweichungen von der Nullhypothese vom Test nicht mehr aufgedeckt werden können.
Für zu kleine Stichproben (genauer: für zu kleine erwartete absolute Häufigkeiten) können die Tests nicht angewendet werden, da dann die näherungsweise Berechnung des p-Werts nicht genau genug ist. Man sollte dann auf ’exakte’ Tests zurückgreifen (z.B. Fisher-Test auf Unabhängigkeit).

Nachteile 2

Ein direkter Vergleich mehrerer Testverfahren bezüglich der Güte (Teststärke) liefert meist kein eindeutiges Ergebnis, da verschiedene Abweichungen von der Nullhypothese denkbar sind und mit bestimmten Tests manche davon ’besser’ und andere ’schlechter’ vom Test angezeigt werden, d.h. die Wahrscheinlichkeit eines signifikanten Ergebnisses ist je nach Wahl des Testverfahrens in manchen Situationen (in denen ${\textstyle H_{1}}$ vorliegt) größer und in anderen kleiner. Es gibt jedoch (je nach Nullhypothese) insbesondere für stetige Verteilungen sinnvolle Alternativen zum ${\textstyle \chi ^{2}}$ -Test, die ’in den meisten Fällen’ mit höherer Wahrscheinlichkeit ein signifikantes Ergebnis liefern (also eine bessere Güte bzw. höhere Teststärke haben).

Seiteninformation

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.

Die Seite wurde als Dokumententyp PanDocElectron-SLIDE erstellt.
Link zur Quelle in Wikiversity: https://de.wikiversity.org/wiki/Kurs:Statistik%20f%C3%BCr%20Anwender/Chi-Quadrat-Tests
siehe auch weitere Informationen zu Wiki2Reveal und unter Wiki2Reveal-Linkgenerator.