Kurs:Statistik für Anwender/Varianzanalyse

Varianzanalyse Bearbeiten

Einfaktorielle Varianzanalyse Bearbeiten

Situation und Hypothesenpaar Bearbeiten

Situation: Gegeben sind   normalverteilte ZV   deren Standardabweichungen   (bzw. Varianzen) gleich sind.

Hypothesenpaar:

 

Äquivalent dazu (unter obigen Voraussetzungen):

 

 

Benötigte Daten Bearbeiten

  unabhängige Stichproben

 

Mittelwerte Bearbeiten

Man berechnet aus den Stichproben:

  • die Gruppenmittelwerte (’mean of groups’):  
  • den Gesamtmittelwert (’grand mean’):  

Beachte: Es gilt:  

Streumaße I Bearbeiten

  • Die Summe der quadratischen Abweichungen aller Stichprobenwerte   vom Gesamtmittelwert   bezeichnet man mit:
     
  • Weiterhin bezeichnet man die Summe der quadratischen Abweichungen aller Stichprobenmittelwerte   vom Gesamtmittelwert   mit:
     

     

    SST ist ein Maß für die Unterschiede zwischen den verschiedenen Stichproben.

Streumaße II Bearbeiten

  • Schließlich bezeichnet man die Summe der quadratischen Abweichungen aller Stichprobenwerte   vom jeweiligen Stichprobenmittelwerte   mit:
     
    SSE ist ein Maß für die Unterschiede innerhalb der einzelnen Stichproben.
    Man beachte, dass gilt:  

Streumaße III Bearbeiten

Man teilt nun SST und SSE durch die Zahl der jeweiligen Freiheitsgrade (falls   gilt, sind   und   jeweils  -verteilt mit   bzw.   FG) und erhält die sogenannten ’mittleren quadratischen Abweichungen’

 

Teststatistik Bearbeiten

Aus SST und SSE berechnet man nun die Teststatistik wie folgt:

 

Idee: MSE stellt eine Schätzung für die Streuung innerhalb der einzelnen Stichproben dar. Im Gegensatz dazu schätzt MST die Streuung der verschiedenen Stichprobenmittelwerte um den Gesamtmittelwert. Nimmt man an, dass   gilt, sollte MST (im Vergleich zu MSE) klein sein, folglich ist   eine Teststatistik, bei der man eher kleine Werte erwartet, falls   gilt.

p-Wert Bearbeiten

Zur Berechung wird die F-Verteilung (bzw. Fisher-Verteilung)   mit den ’Freiheitsgraden’   und   benötigt. Es gilt:  
(Dies geht in R mit  .)

Durchführung in R Bearbeiten

Einlesen der Stichproben in einen gemeinsamen Vektor x zusammen mit einem Faktor g (gleicher Länge), der angibt, zu welcher Größe die jeweiligen Komponenten von x gehören. Dann:   

Beispiel 1.1 Bearbeiten

Verschiedene Drahtsorten ( ) werden auf Zugfestigkeit untersucht. Dabei soll zu   geprüft werden, ob die verschiedenen Drahtsorten (oder einige der Sorten) im erwarteten Mittel unterschiedliche Zugfestigkeiten aufweisen. Dazu nimmt man an, dass die ZV  , die die Zugfestigkeiten der verschiedenen Sorten beschreiben, normalverteilt mit gleicher Varianz sind und formuliert die Nullhypothese:
 

Beispiel 1.2 Bearbeiten

Man erhält folgende Daten (in  ):

 

Daraus berechnet sich:
  und  


Folglich zeigen die Daten keine siginifikanten Unterschiede zwischen den Zugfestigkeiten der verschiedenen Drahtsorten. Die Nullhypothese ist mit den Daten vereinbar.

Beispiel 1.3 Bearbeiten

Man kann obige Rechnungen auch in R durchführen lassen. Dies geht etwa mit

 

Anmerkungen I Bearbeiten

  • Die oben genannten Voraussetzungen für die Varianzanalyse mit dem F-Test können (und sollten) mit Hilfe von Vortests empirisch geprüft werden. Die Normalverteilungsannahme kann mit Shapiro-Wilks-Tests für jede der ZV   getestet werden. Die Annahme der Varianzgleichheit kann man dann mit einem sogenannten Bartlett-Test prüfen. Liefert einer der Vortests ein signifikantes Ergebnis (bzw. einen kleinen  -Wert), so kann der F-Test nicht verwendet werden. Man muss dann auf andere Testverfahren zurückgreifen. Beispielsweise kann dann der Test von Kruskal und Wallis verwendet werden.

Anmerkungen II Bearbeiten

  • Falls die Varianzanalyse ein signifikantes Ergebnis liefert, wird dadurch lediglich angezeigt, dass nicht alle   gleich sind. Zur Klärung der Frage,welche der   signifikant als verschieden angesehen werden können, stehen weitere Testverfahren zur Verfügung, bespielsweise der Scheffé-Test oder der Tukey-Test.

Aufgabe 1.1 Bearbeiten

In einer Studie soll untersucht werden, wie sich die Wildschweinpopulationsdichte auf den Traubenertrag im Weinbau auswirkt. Für die Studie wurden 3 Gebiete identifiziert, in denen Weinbau betrieben wird, die jedoch unterschiedliche Populationsdichten an Wildschweinen aufweißen. In jedem Gebiet befinden sich unterschiedlich viele Versuchsflächen, die jeweils gleich bewirtschaftet werden. Bei jeder Testfläche wurde am Ende der Traubensaison der Ertrag an Trauben in Tonnen pro Hektar ermittelt. Es ergeben sich folgende Daten:

 

Aufgabe 1.2 Bearbeiten

  • Worauf sollte bei der Auswahl der Testgebiete geachtet werden? (Stichwort Randeffekte)
  • Überprüfen Sie mit dem Shapiro-Wilks- und dem Bartlett-Test (in R - keine Rechnung notwendig), ob die Voraussetzungen für die Einfaktorielle Varianzanalyse gegeben sind.

Der Tukey-Test (bzw. die Tukey-Methode) Bearbeiten

Situation, Signifikanzniveau und Nullhypothese Bearbeiten

Situation: Gegeben sind   normalverteilte ZV   deren Standardabweichungen   (bzw. Varianzen) gleich sind.

Signifikanzniveau: Es muss ein Signifikanzniveau   festgelegt werden.

Nullhypothesen:   für   mit  
Alle diese Nullhypothesen werden gemeinsam getestet. Das bedeutet: Falls alle   wahr sind, erhält man höchstens mit Wahrscheinlichkeit   mindestens ein signifikantes Ergebnis.

Benötigte Daten und Teststatistik Bearbeiten

benötigte Daten:   unabhängige Stichproben gleicher Länge  

 

Die Gesamtlänge   ergibt sich dann offenbar als  .

Teststatistik: Man berechnet zunächst paarweise die (betragsmäßigen) Differenzen der empirischen Mittelwerte, also  
und die mittlere quadratische Abweichung der Fehler  
Daraus berechnen sich die Teststatistiken als

 

Offenbar sprechen hohe Werte dieser Statistik gegen  .

p-Werte Bearbeiten

 -Werte: Zur Berechung wird die studentisierte Spannweite   mit den ’Freiheitsgraden’   und   benötigt. Zur Nullhypothese   ist der  -Wert gegeben durch:
 
(Dies geht in R mit ptukey(x,m,n-m).)

Für die Paare  , deren  -Wert kleiner oder gleich   sind, kann also die entsprechende Nullhypothese   verworfen werden. Man hat dann ein oder mehrere signifikante Ergebnisse zum gemeinsamen Niveau  , d.h. es wurde berücksichtigt, dass man mehrere Nullhypothesen getestet hat.

Durchführung in R Bearbeiten

Einlesen der Stichproben in einen gemeinsamen Vektor x zusammen mit einem Faktor g (gleicher Länge), der angibt, zu welcher Größe die jeweiligen Komponenten von x gehören. Dann:  

Zur Ausgabe gehören neben den  -Werten der einzelnen Nullhypothesen auch Konfidenzintervalle zum (gemeinsamen) Niveau   für die Differenzen der wahren Erwartungswerte  . Diese Intervalle lassen sich mit   auch graphisch darstellen.

Das bedeutet, dass (falls alle   gelten) die Wahrscheinlichkeit, dass alle berechneten Konfidenzintervalle die entsprechende wahre Erwartungswertdifferenz enthalten, mindestens   ist.

Variante Bearbeiten

Für unterschiedliche Stichprobenlänge   von   berechnet man die Teststatistiken wie folgt (Tukey-Kramer-Methode):

 

Beispiel 1.1 Bearbeiten

Wir betrachten die folgenden Stichproben ( ) zum Signifikantsniveau  .

 

Man berechnet   und  . Damit ergibt sich der  -Wert einer Varianzanalyse mit einem  -Tests zur Nullhypothese als  . Man kann also davon ausgehen, dass sich Erwartungswerte einiger der Größen unterscheiden.

Beispiel 1.2 Bearbeiten

Man möcht nun genauer wissen, welche der Erwartungswerte sich im einzelnen unterscheiden. Dazu führt man einen Tukey-Test durch. Insgesamt werden dabei 10 Vergleiche durchgeführt:

 

Damit wird also signifikant angezeigt, dass sich die Großen   und   und auch die Großen   und   hinsichtlich ihrer Erwartungswerte unterscheiden.

Beispiel 1.3 Bearbeiten

Legt man ein Signifikanzniveau   fest, so kann man mit TukeyHSD eine Graphik erzeugen, die Konfidenzintervalle zum gemeinsamen Niveau   zeigt:

 

Aufgabe Bearbeiten

Nehmen Sie nun an, dass Sie in der vorherigen Aufgabe ein Signifikantes Ergebnis erhalten hätten. Berechnen Sie nun mithilfe der Tukey-Methode, zwischen welchen Gruppen signifikante Unterschiede existieren.

Zweifaktorielle Varianzanalyse Bearbeiten

Es soll untersucht werden, ob eine ZV   (Zielvariable) durch zwei vorliegende Faktoren   und   beeinflusst wird. Die Faktoren   und   nehmen dabei nur endlich viele Werte (bzw. Ausprägungen) an (  Möglichkeiten für   und   Möglichkeiten für  ).

Betrachtung als Zufallsvariablen Bearbeiten

Man unterscheidet nun ZV

 

wobei   die Größe   für die  -te Ausprägung von   und die  -te Ausprägung von   ist  .

Voraussetzung und Nullhypothese Bearbeiten

Vorausgesetzt für den folgenden Test wird, dass alle   normalverteilt mit gleicher Varianz sind.
Man untersucht dabei die Nullhypothesen

 

 

 

Stichproben Bearbeiten

Zu jeder der   vielen Größen benötigt man nun eine Stichprobe

 

(Wir gehen der Einfachheit halber davon aus, dass alle Stichproben die gleiche Länge haben. Für ungleiche Stichprobenlängen wird es nochmals erheblich komplizierter.)

Zu berechnende Werte und Parameter I Bearbeiten

Daraus berechnet man nun die folgenden Mittelwerte und Stichprobenlängen:

  • Einzelne Stichprobe (  fest):
     

Zu berechnende Werte und Parameter II Bearbeiten

  • Mit festem Wert für   zusammengefasste Stichprobe (  fest):
     

Zu berechnende Werte und Parameter III Bearbeiten

  • Mit festem Wert für   zusammengefasste Stichprobe (  fest):
     

Zu berechnende Werte und Parameter IV Bearbeiten

  • Gesamte Stichprobe:
     

Quadratsummenzerlegung I Bearbeiten

Es gilt die folgende Quadratsummenzerlegung:

 

Quadratsummenzerlegung II Bearbeiten

Dabei ist:

 

Teststatistik Bearbeiten

Zu den oben angegebenen Nullhypothesen berechnet man nun Teststatistik und  -Wert wie folgt:

 

Durchführung in R Bearbeiten

Man kann diese auch mit R durchführen. Man trägt dazu in einen Vektor x die Daten ein und in zwei Faktoren a und b (beide haben die gleiche Länge wie x) die Information, zu welcher Ausprägung von   bzw.   die Daten gehören. Dann erhält man mit:

 


die benötigten Werte (Freiheitsgrade, Quadratsummen, mittlere Quadratsummen, Teststatistiken,  -Werte).

Beispiel 1.1 Bearbeiten

Gegeben seien die Faktoren   und   mit den Ausprägungen   und  , dem Signifikanzniveau   und der folgenden Stichprobe:

 

Beispiel 1.2 Bearbeiten

Es ergibt sich:

 

Somit kann die Nullhypothese, dass   unabhängig von   ist, verworfen werden.
Weiterhin ergibt sich:

 

Somit kann auch diese Nullhypothese, dass   unabhängig von   ist, verworfen werden.
Weiterhin ergibt sich:

 
Die Nullhypothese, dass es keine Wechselwirkung zwischen   und   im Hinblick auf   gibt, kann nicht wiederlegt werden, somit ist es anzunehmen, dass es keine Wechselwirkung gibt.

Seiteninformation Bearbeiten

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal Bearbeiten

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.