Kurs:Statistik für Anwender/Hypergeometrischverteilte Zufallsvariable

Hypergeometrisch verteilte ZV

Bearbeiten

Situation

Bearbeiten

In einer Menge von   Objekten sind   Objekte mit einer bestimmten Eigenschaft ausgezeichnet. Nun werden daraus   Objekte zufällig ausgewählt (gezogen). Wichtig ist dabei, dass die Ziehung zufällig und unabhängig von der Eigenschaft ist, d.h. die ausgezeichneten Objekte haben dieselbe Chance gezogen zu werden, wie die anderen Objekte.

Hypergeometrisch verteilte ZV

Bearbeiten

Die ZV   beschreibt die Zahl   der ausgezeichneten Objekte unter den Gezogenen.

Man sagt:   ist hypergeometrisch verteilt mit   Ausgezeichneten bei   Objekten insgesamt (bzw. mit   Nicht-Ausgezeichneten) und   Gezogenen.
Die möglichen Werte von   sind dann   und es gilt:  

Beispiel 1

Bearbeiten

Für   und   ist beispielsweise:
 

Beispiel 2.1

Bearbeiten

Für   ist:
 

Beispiel 2.2

Bearbeiten

 

Beispiel 3

Bearbeiten

Hier einige weitere Beispiele:

 

Interkatives Beispiel

Bearbeiten

Interaktive Shiny-App zur Hypergeometrischen Verteilung:
Download und Link

Wahrscheinlichkeiten

Bearbeiten

Es folgt:
 
 
 

Beispiel 4

Bearbeiten

Für   und   ist beispielsweise:
 


Berechnung in R

Bearbeiten

In R:

 


Aufgabe 1

Bearbeiten

Berechnen Sie für eine hypergeometrisch verteilte ZV   mit den jeweils angegebenen Werten für   und   die angegebenen Wahrscheinlichkeiten:

  • Für   und  :   für alle  
  • Für   und  :  
  • Für   und  :  

Beispiel 5

Bearbeiten
  • (Ziehen ohne Zurücklegen) Aus einer Lostrommel, die   Kugeln enthält, von denen   rot sind, werden ohne Zurücklegen   Kugeln gezogen. Die ZV für die Anzahl der roten Kugeln unter den Gezogenen ist hypergeometrisch verteilt.

Beispiel 6

Bearbeiten
  • In einem Teich befinden sich   Fische einer Art, von denen   markiert sind. Nun werden   Fische gefangen. Die ZV für die Zahl der markierten Fische unter den Gefangenen ist hypergeometrisch verteilt mit   und  . (Voraussetzung: Die markierten Fische sind über den See gleichmäßig verteilt und lassen sich genauso leicht fangen, wie die Übrigen.)

Beispiel 7

Bearbeiten
  • In einer Klasse befinden sich   Jungen und   Mädchen. Es werden   Schüler/innen für ein Projekt ausgelost. Die ZV, die die Zahl der Jungen unter den Ausgelosten angibt, ist hypergeometrisch verteilt mit   und  .

Aufgabe 2

Bearbeiten

Wie groß ist beim Lotto (6 aus 49) die Wahrscheinlichkeit, genau   Richtige zu haben ( ).

Aufgabe 3

Bearbeiten

Bei einem Multiple-Choice Test gibt es 20 Aussagen, von denen genau 10 richtig sind. Ein unvorbereiteter Teilnehmer kreuzt willkürlich genau 10 Aussagen an. Wie groß ist die Wahrscheinlichkeit, dass dabei   der angekreuzten Aussagen richtig sind?

Aufgabe 4

Bearbeiten

Unter 500 Glühbirnen in einem Karton befinden sich 35 defekte. Bei einer Qualitätskontrolle werden 50 Birnen getestet. Wie groß ist die Wahrscheinlichkeit, dass   der Birnen defekt ist?

Erwartungswert und Varianz

Bearbeiten

Für eine hypergeometrisch verteilte ZV   mit   wie bisher gilt:
 

Beispiel 8

Bearbeiten

Für   und   haben wir oben bereits die Wahrscheinlichkeitsverteilung bestimmt. Daraus ergibt sich:  

Beispiel 9

Bearbeiten

Für   und   berechnen wir zunächst
 
für alle möglichen Werte  :
 
Daraus ergibt sich:
 

Aufgabe 5

Bearbeiten

Bestimmen Sie für eine hypergeometrsich verteilte ZV   mit  ,   und   die nachfolgenden Werte:

  1.  
  2.  
  3.  
  4.  


Bestimmen Sie Erwartungswert und Varianz.

Aufgabe 6

Bearbeiten

Wenn für die Vorlesung 79 Menschen angemeldet sind, von denen ca. 30 Personen auch regelmäßig in die Vorlesung kommen. Die Klausur wird von 40 Personen geschrieben. Wie hoch ist die Wahrscheinlichkeit, dass

  1. alle 30 Personen aus der Vorlesung die Klausur mitschreiben?
  2. mindestens 20 Personen aus der Vorlesung die Klausur mitschreiben?
  3. maximal 20 Personen aus der Vorlesung die Klausur mitschreiben?

Bestimmen Sie auch Erwartungswert und Varianz.

Schätzung der Zahl der ausgezeichneten Objekte K

Bearbeiten

Beispiel 1

Bearbeiten

Von   Glübirnen einer Lieferung sind eine unbekannte Anzahl   defekt. Man testet   zufällig ausgewählte Birnen und stellt fest, dass   davon defekt sind. Wie kann man daraus auf die Zahl   schließen?

Situation

Bearbeiten

Situation:

 

Genauer:

  •   und   sind feststehend und bekannt. Oft kann man   selbst festlegen.
  •   entsteht zufällig, ist dann aber bekannt.
  •   steht fest, ist aber nicht bekannt.

  Wiederum ist dabei folglich die Schätzung zufällig.

Erwartungstreue Punktschätzungen für K

Bearbeiten

Durch   erhält man eine erwartungstreue Schätzung für  .

Genauer: Die Zahl   hängt vom Zufall ab und wird (vor der Datenerhebung) durch die ZV   beschrieben. Da die Schätzung für (die feste aber unbekannte Zahl)   von   abhängt, ist sie ebenfalls vom Zufall abhängig. Die Schätzung   kann somit als ZV beschrieben werden. Dabei gilt dann (unabhängig vom unbekannten Wert
 ) stets  .


Beispiel 2

Bearbeiten

 

Das Maximum-Likelihood-Prinzip 1

Bearbeiten

Mit der Maximum-Likelihood-Methode wird   (basierend auf der zufälligen Zahl  ) so geschätzt, dass die Wahrscheinlichkeit   maximal wird. Wir suchen also die Maximumstelle der Likelihood-Funktion
 

Das Maximum-Likelihood-Prinzip 2

Bearbeiten

Man stellt fest:
Die Maximumstelle(n) von   ist/sind:
 
(dabei bezeichnet   die größte ganze Zahl, die kleiner oder gleich   ist)


Beispiel 3.1

Bearbeiten

 


Beispiel 3.2

Bearbeiten

  und  
 
 

Intervallschätzungen für K

Bearbeiten

Gib eine Methode an, mit der man aus   ein Intervall   bestimmen kann, so dass die Wahrscheinlichkeit, dass sich ein Intervall ergibt, das   enthält, garantiert (also für jeden denkbaren Wert von  ) größer oder gleich einem vorgegebenen Konfidenzniveau   ist.
 

    Eine sinnvolle Möglichkeit wird im Folgenden beschrieben:


IVS für K, die ein gegebenes Konfidenzniveau einhält

Bearbeiten

Gegeben seien   und  . Unbekannt sei  . Weiter sei ein Konfidenzniveau   vorgegeben.
Basierend auf der zufälligen Zahl   geht man nun wie folgt vor:

Bestimmung von Ku
Bearbeiten
  • Man bestimmt   als die kleinstmögliche Zahl mit   
Bestimmung von Ko
Bearbeiten
  • Man bestimmt   als die größtmögliche Zahl mit    

Konfidenzniveau

Bearbeiten

Ohne weiter in die mathematischen Hintergründe einzusteigen, halten wir fest, dass die folgende (bei Intervallschätzungen immer zu erreichende) Bedingung bei diesem Verfahren garantiert erfüllt ist:
 
Man beachte, dass der Aussage "  " eine Wahrscheinlichkeit zugeschrieben werden kann, weil die Intervallgrenzen   und   zufällig sind (und nicht etwa der unbekannte Wert  ).

Beispiel 1.1

Bearbeiten

Wir betrachten erneut den Fall   und führen eine Intervallschätzung zum Niveau   durch.

  • Wir suchen also zunächst die kleinstmögliche Zahl   mit   
    Durch Ausprobieren findet man:
     

Beispiel 1.2

Bearbeiten
  • Analog suchen wir die größtmögliche Zahl mit   
    Durch Ausprobieren findet man:  

Damit ist   das gesuchte Konfidenzintervall zu  .


Beispiel 2.1

Bearbeiten

Für   und   berechnet man abhängig von   die folgenden ML-Schätzungen und Intervallschätzungen zum Vertrauensniveau  :
 
 

Beispiel 2.2

Bearbeiten
  • Angenommen, es ist  . Dann ist die Intervallschätzung für   korrekt. Die Wahrscheinlichkeit dafür ist:
     
  • Angenommen, es ist  . Dann ist die Intervallschätzung für   korrekt. Die Wahrscheinlichkeit dafür ist:
     

Beispiel 2.3

Bearbeiten
  • Angenommen, es ist  . Dann ist die Intervallschätzung nur für   korrekt. Die Wahrscheinlichkeit dafür ist:

 

Korrektheit der IVS

Bearbeiten

Das mathematische Modell garantiert, dass die Intervallschätzung bei beliebigem   immer mindestens mit der Wahrscheinlichkeit   korrekt ist.

Aufgabe 1

Bearbeiten

In Ihrem Wohnort stehen   Wohngebaude. Sie wissen, dass nur Eines von Vieren einen Keller hat.

  1. Führen Sie für   eine Punktschätzung durch, stellen Sie die Maximum-Likelihood-Funktion auf und plotten Sie diese in R.
  2. Geben Sie die Formeln für die Intervallschätzung mit   für   an.

Schätzung der Gesamtzahl der Objekte N

Bearbeiten

Beispiel (Capture-Recapture)

Bearbeiten

In einem See befindet sich eine unbekannte Anzahl   von Fischen einer Art. Man möchte wissen, wie groß   in etwa ist. Dazu fängt man eine (kleinere) Anzahl   von Fischen und markiert sie. Dann setzt man sie wieder aus und wartet einen angemessenen Zeitraum. Dann fängt man in einem zweiten Fischzug   Fische und bestimmt die Anzahl   der markierten Fische unter ihnen.
Beispielsweise hat man   Fische markiert und unter   gefangenen Fischen   markierte Fische wiedergefunden.

Wie kann man daraus eine sinnvolle Schätzung für   abgeben?

Situation
Bearbeiten
Situation:

  Genauer:

  •   und   sind fest und bekannt. Manchmal kann man   und   selbst festlegen.
  •   entsteht zufällig, ist dann aber bekannt.
  •   mit   steht fest, ist aber nicht bekannt.

  Wiederum ist damit die Schätzung zufällig.

Erwartungstreue Punktschätzungen für N

Bearbeiten

Durch   erhält man eine Schätzung für  .

Dabei gilt:   ist erwartungstreu für  .

Genauer: Die Zahl   hängt vom Zufall ab und wird (vor der Datenerhebung) durch die ZV   beschrieben. Da die Schätzung für (die feste aber unbekannte Zahl)   von   abhängt, ist sie ebenfalls vom Zufall abhängig. Die Schätzung   kann somit als ZV beschrieben werden. Dabei gilt dann (unabhängig vom unbekannten Wert  ) stets  .

Beispiel 1

Bearbeiten

 

Schätzung für N mit der Maximum-Likelihood-Methode

Bearbeiten

Mit der Maximum-Likelihood-Methode wird   (basierend auf der zufälligen Zahl  ) so geschätzt, dass die Wahrscheinlichkeit   maximal wird. Wir suchen also die Maximumstelle der Likelihood-Funktion
 

Maximumstellen

Bearbeiten

Man stellt fest:
Die Maximumstelle(n) ist/sind von  :   (dabei bezeichnet   die größte ganze Zahl, die kleiner oder gleich   ist)


Beispiel 2.1

Bearbeiten

 


Beispiel 2.2

Bearbeiten

 
 
 

Intervallschätzungen für N

Bearbeiten

Gib eine Methode an, mit der man aus   ein Intervall   bestimmen kann, so dass die Wahrscheinlichkeit, dass sich ein Intervall ergibt, das   enthält, auf jeden Fall (also für jeden denkbaren Wert von  ) mindestens ein vorgegebenes Konfidenzniveau   ist.
  
 
Eine sinnvolle Möglichkeit wird im Folgenden beschrieben.

IVS für N, die ein gegebenes Konfidenzniveau einhält

Bearbeiten

Gegeben seien  . Unbekannt sei  . Weiter sei ein Konfidenzniveau   vorgegeben.
Basierend auf der zufälligen Zahl   geht man nun wie folgt vor:

Bestimmung von Nu
Bearbeiten
  • Man bestimmt   als die kleinstmögliche Zahl mit
      
Bestimmung von No
Bearbeiten
  • Man bestimmt   als die größtmögliche Zahl mit
      

Konfidenzniveau

Bearbeiten

Wir halten fest, dass die folgende (bei Intervallschätzungen immer zu erreichende) Bedingung bei diesem Verfahren garantiert erfüllt ist:   Man beachte, dass der Aussage " "  eine Wahrscheinlichkeit zugeschrieben werden kann, weil die Intervallgrenzen   und   zufällig sind (und nicht etwa der unbekannte Wert  ).

Beispiel 1.1

Bearbeiten

Wir betrachten erneut den Fall   und führen eine Intervallschätzung zum Niveau   durch.

  • Wir suchen also zunächst die kleinstmögliche Zahl   mit    Durch Ausprobieren findet man:  

Beispiel 1.2

Bearbeiten
  • Analog suchen wir die größtmögliche Zahl mit    Durch Ausprobieren findet man:  

Damit ist   das gesuchte Konfidenzintervall zu  .

Aufgabe 1

Bearbeiten

Einige Zeit nach einem Wiederansiedlungsversuch einer Spezies wollen Sie wissen, ob dieser geglückt ist und die Spezies sich vermehrt hat.

  1. Geben Sie an, wie Sie zur Überprüfung vorgehen würden (Sie können nicht alle Exemplare zählen).
  2. Seien nun  . Bestimmen Sie   mittels der einfachen Punktschätzung, stellen Sie die Maximum-Likelihood-Funktion auf, plotten diese in R und führen eine Intervallschätzung mit   durch.
  3. Was fällt Ihnen hinsichtlich der verschiedenen Schätzungen auf? Vergleichen Sie Ihre Ergebnisse.


Seiteninformation

Bearbeiten

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Bearbeiten

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.