Kurs:Statistik für Anwender/Tests zur Binomialverteilung

Tests zur Binomialverteilung Bearbeiten

Situation Bearbeiten

Die Trefferwahrscheinlichkeit   einer Binomialverteilung ist unbekannt.
Wir betrachten in diesem Kapitel einige Nullhypothesen bezüglich   (einseitige und zweiseitige Tests) und erklären jeweils die Berechnung des p-Werts. Alle Verfahren basieren dabei auf der Trefferzahl   bei   Versuchen.

Linksseitiger Test Bearbeiten

Voraussetzung, Hypothesenpaar, Teststatistik Bearbeiten

Voraussetzung:   binomialverteilt mit Versuchszahl   und Trefferwahrscheinlichkeit  

Hypothesenpaar:   und   (linksseitiger Test)
(Dabei ist   vorgegeben.)

Vorliegende Daten: Trefferzahl  

Teststatistik: Trefferzahl   (niedrige Werte von   sprechen gegen  )

p-Wert und Ablehnbereich Bearbeiten

 -Wert zu konkreter Trefferzahl   :
  

Ablehnbereich bei gegebenem Signifikanzniveau  :

 

Durchführung mit R:   "less ")

Beispiel linksseitiger Test I Bearbeiten

Die Nullhypothese besagt, dass ein Medikament in mindestens 70% aller Fälle eine Nebenwrkung auftritt, also  

  • Um die Nullhypothese zu testen, legt man ein Signifikanzniveau   fest und beobachtet 100 Patienten, die das Medikament einnehmen. Die Wirkung tritt in 64 Fällen ein. Reicht dies aus, um die Nullhypothese abzulehnen?

     
     

    Folglich kann die Nullhypothese nicht abgelehnt werden. (Sie könnte allerdings trotzdem falsch sein, allerdings rechtfertigen die Daten keine Ablehnung zum gegebenen Signifikanzniveau.)
Beispiel linksseitiger Test II Bearbeiten
  • Angenommen die Nebenwirkung wäre bei nur 59 Patienten eingetreten. In diesem Fall

     
     

    Die Nullhypothese kann nun also abgelehnt werden. Sie könnte dennoch gelten, aber wir wissen: Wenn   gilt, ist eine Ablehnung unwahrscheinlich (genauer:  ). Eine Ablehung spricht daher gegen  .
  • Man stellt bei   fest:  

Rechtsseitiger Test Bearbeiten

Voraussetzung, Hypothesenpaar, Teststatistik Bearbeiten

Voraussetzung:   binomialverteilt mit Versuchszahl   und Trefferwahrscheinlichkeit  

Hypothesenpaar:   und   (rechtsseitiger Test)
(Dabei ist   vorgegeben.)

Vorliegende Daten: Trefferzahl  

Teststatistik: Trefferzahl   (hohe Werte von   sprechen gegen  )

p-Wert und Ablehnbereich Bearbeiten

 -Wert zu konkreter Trefferzahl   :
  

Ablehnbereich bei gegebenem Signifikanzniveau  :

 

Durchührung mit R:  " greater ")

Beispiel rechtsseitiger Test I Bearbeiten

Die Nullhypothese besagt, dass nach Kalkeinsatz mit einer Wahrscheinlichkeit von höchstens 80% eine bestimmte Verbesserung des Waldbodens eintritt, also:  

  • Um die Nullhypothese zu testen, legt man ein Signifikanzniveau   fest und führt   Kalkeinsätze durch. Die Wirkung tritt in   Fällen ein. Es gilt:

     

     
  • Also gilt zum Signifikanzniveau  :  

Beispiel rechtsseitiger Test II Bearbeiten

  • Hätte man das Signifikanzniveau auf   festgelegt, so hätte dieser Nachweis selbst bei 20 (von 20) Treffern nicht gelingen können, denn es gilt

     

     

Beispiel rechtsseitiger Test III Bearbeiten

  • Man hätte auch die Nullhypothese   betrachten können:

    Hierbei hätte man (wie in 1.) erklärt) zum Signifikanzniveau   erhalten:  

  • Wir haben festgestellt: Liegt die Trefferzahl zwischen 14 und 18, so kann man weder die Nullhypothese   noch die Nullhypothese   (zum Signifikanzniveau  ) ablehnen. In diesem Fall reichen die Daten (Trefferzahl) nicht aus, um (mit einer Irrtumswahrscheinlichkeit von nicht mehr als  ) zu entscheiden, ob   oder   ist.

Zweiseitiger Test Bearbeiten

Wir betrachten nun das Hypothesenpaar:

 

An diesem Fall soll verdeutlicht werden, dass es bisweilen mehrere sinnvolle Testverfahren gibt, die unterschiedliche Ergebnisse liefern können.

Klar ist hier: Die Nullhypothese sollte sowohl für zu kleine und auch für zu große beobachtete Trefferzahlen abgelehnt werden.

Anmerkung Bearbeiten

Zu einer seriösen Vorgehensweise gehört es, sich vor der Datenerhebung auf ein Testverfahren festzulegen (und nicht im Nachhinein ein Testverfahren auszuwählen, dass bei den vorliegenden Daten einen möglichst kleinen  -Wert hat, um so ein signifikantes Ergebnis zu erhalten).

1. Methode: Bearbeiten

Voraussetzung und Hypothesenpaar Bearbeiten

Voraussetzung:   binomialverteilt mit Versuchszahl   und Trefferwahrscheinlichkeit  

Hypothesenpaar:   und  

Vorliegende Daten: Trefferzahl  

Teststatistik und p-Wert Bearbeiten

Teststatistik:   (hohe Werte von   sprechen gegen  )
Idee: Falls   gilt, ist   und damit ist  . Die Teststatistik   gibt die Abweichung der Trefferzahl von ihrem Erwartungswert (unter  ) an.

 -Wert zu konkreter Teststatistik   :

 

  ist dabei ebenfalls eine Zufallsvariable, welche mit   konkrete Realisierungen für jede mögliche Trefferzahl   annimmt.

Beispiel 1. Methode I Bearbeiten

Wir führen dies am Beispiel   durch. Die verschiedenen Trefferzahlen   haben die folgenden Teststatistiken:

 

Beispiel 1. Methode II Bearbeiten

Damit erhält man (exemplarisch) die folgenden  -Werte:

  • Angenommen es ergibt sich die Trefferzahl  . Dann ist  . Der  -Wert berechnet sich als Wahrscheinlichkeit (unter der Annahme, dass   wahr ist, also tatsächlich   gilt):

     
  • Angenommen es ergibt sich die Trefferzahl  . Dann ist  . Der  -Wert berechnet sich als Wahrscheinlichkeit (unter der Annahme, dass   wahr ist, also tatsächlich   gilt):

     
Beispiel 1. Methode III Bearbeiten
  • Angenommen es ergibt sich die Trefferzahl  . Dann ist  . Der  -Wert berechnet sich als Wahrscheinlichkeit (unter der Annahme, dass   wahr ist, also tatsächlich   gilt):

     
  • Angenommen es ergibt sich die Trefferzahl  . Dann ist  . Der  -Wert berechnet sich als Wahrscheinlichkeit (unter der Annahme, dass   wahr ist, also tatsächlich   gilt):

     
Beispiel 1. Methode IV Bearbeiten

Mit dieser Methode kann zu jeder Trefferzahl der  -Wert bestimmt werden.

  wird genau dann abgelehnt, wenn der  -Wert   ist. Bei   ist dies für   der Fall.


Der  -Wert entspricht damit der Wahrscheinlichkeit (bei Gültigkeit von  ), dass beobachtete Ergebnis oder ein im Hinblick auf   noch extremeres  Ergebnis zu erhalten. Bei dieser Methode wurde eine Trefferzahl als extrem  angesehen, wenn sie stark vom Erwartungswert (unter  ) abweicht.

2. Methode: Bearbeiten

Voraussetzung und Hypothesenpaar Bearbeiten

Voraussetzung:   binomialverteilt mit Versuchszahl   und Trefferwahrscheinlichkeit  

Hypothesenpaar:   und  

Vorliegende Daten: Trefferzahl  

Teststatistik und p-Wert Bearbeiten

Teststatistik:   (niedrige Werte von   sprechen gegen  )
Idee: Falls   gilt, ist   und damit ist  . Die Teststatistik   gibt an, wie wahrscheinlich die beobachtete Trefferzahl ist, falls   gilt.

 -Wert zu konkreter Teststatistik   :

 

  ist dabei ebenfalls eine Zufallsvariable, welche mit   konkrete Realisierungen für jede mögliche Trefferzahl   annimmt.

Durchführung mit R:   

Beispiel 2. Methode I Bearbeiten
  • Betrachte:   (also  ) im Fall  

    Wir berechnen zunächst zu jeder möglichen Trefferzahl   den Wert   (  Wahrscheinlichkeit für die Trefferzahl  , falls die Nullhypothese gilt):

 

Beispiel 2. Methode II Bearbeiten

Wir berechnen nun für alle möglichen Trefferzahlen   den  -Wert:

 

Beispiel 2. Methode III Bearbeiten
  • Betrachtet man wieder das Beispiel, dass wir mit Methode 1 schon behandelt hatten (also  ), so kommt man mit Methode 2 zu einer Ablehnung von  , falls  . (An diesem Beispiel sieht man also, dass man mit den beiden Methoden zu verschiedenen  -Werten und verschiedenen Ablehnbereichen kommen kann.)

Der  -Wert entspricht damit der Wahrscheinlichkeit (bei Gültigkeit von  ), dass beobachtete Ergebnis oder ein im Hinblick auf   noch extremeres Ergebnis zu erhalten. Bei diesem Test wurde eine Trefferzahl als extrem angesehen, wenn sie unwahrscheinlich ist, falls   gilt.

Aufgabe 1.1 Bearbeiten

Bestimmen Sie für die folgenden Nullhypothesen (bezüglich der Trefferwahrscheinlichkeit   einer Binomialverteilung) jeweils die Ablehnbereiche   zu den angegebenen Versuchszahlen   und Signifikanzniveaus  .
Wie wirkt es sich auf die Teststärke aus, wenn man die Versuchszahl erhöht bzw. das Signifikanzniveau   verringert?
(Hinweis: Geben Sie den p-Wert zuerst als Formel an, in die Sie alle bekannten Werte einsetzen.)

Nullhypothese  .

 

Aufgabe 1.2 Bearbeiten

Nullhypothese   .

 

Aufgabe 2.1 Bearbeiten

Berechnen Sie zu den angegebenen Nullhypothesen zur Trefferwahrscheinlichkeit   einer Binomialverteilung bei   Versuchen den p-Wert aller möglichen Trefferzahlen   und daraus den Ablehnbereich für die angegebenen Signifikanzniveaus. Verwenden Sie den links- und rechtsseitigen Binomialtest aus der Vorlesung.
(Hinweis: Geben Sie den p-Wert zuerst als Formel an, in die Sie alle bekannten Werte einsetzen und bestimmen Sie dann (z.B. mit R) die konkreten Werte.)

Aufgabe 2.2 Bearbeiten

Nullhypothese  ,  .

 

 

Aufgabe 2.3 Bearbeiten

Nullhypothese   ,  .

 

 

Aufgabe 3.1 Bearbeiten

Berechnen Sie zu der angegebenen Nullhypothese zur Trefferwahrscheinlichkeit   einer Binomialverteilung bei   Versuchen den p-Wert aller möglichen Trefferzahlen   und daraus den Ablehnbereich für die angegebenen Signifikanzniveaus. Verwenden Sie den beidseitigen (Methode 1 und Methode 2) Binomialtest aus der Vorlesung. Vergleichen Sie die Ergebnisse.

(Hinweis: Geben Sie den p-Wert zuerst als Formel an, in die Sie alle bekannten Werte einsetzen und bestimmen Sie dann (z.B. mit R) die konkreten Werte.)

Aufgabe 3.2 Bearbeiten

Nullhypothese  ,  .

 

 

Seiteninformation Bearbeiten

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal Bearbeiten

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.