Kurs:Stochastik/hypergeometrische Verteilung

Einführung

Bearbeiten

Die hypergeometrische Verteilung ist eine Wahrscheinlichkeitsverteilung in der Stochastik. Sie ist univariat und zählt zu den diskreten Wahrscheinlichkeitsverteilungen. In Abgrenzung zur allgemeinen hypergeometrischen Verteilung wird sie auch klassische hypergeometrische Verteilung genannt.[1]

Dichotomie: Fehlerhaft, in Ordnung

Bearbeiten

Einer dichotomen Grundgesamtheit werden in einer Stichprobe zufällig   Elemente ohne Zurücklegen entnommen. Die hypergeometrische Verteilung gibt dann Auskunft darüber, mit welcher Wahrscheinlichkeit in der Stichprobe eine bestimmte Anzahl von Elementen vorkommt, die die gewünschte Eigenschaft haben. Bedeutung kommt dieser Verteilung daher etwa bei Qualitätskontrollen zu.

Rückführung auf Urnenmodell

Bearbeiten

Die hypergeometrische Verteilung wird modellhaft dem Urnenmodell ohne Zurücklegen zugeordnet (siehe auch Kombination ohne Wiederholung). Man betrachtet speziell in diesem Zusammenhang eine Urne mit zwei Sorten Kugeln. Es werden   Kugeln ohne Zurücklegen entnommen. Die Zufallsvariable   ist die Zahl der Kugeln der ersten Sorte in dieser Stichprobe.

Anwendungskontext

Bearbeiten

Die hypergeometrische Verteilung beschreibt also die Wahrscheinlichkeit dafür, dass bei   gegebenen Elementen („Grundgesamtheit des Umfangs  “), von denen   die gewünschte Eigenschaft besitzen, beim Herausgreifen von   Probestücken („Stichprobe des Umfangs  “) genau   Treffer erzielt werden, d. h. die Wahrscheinlichkeit für   Erfolge in   Versuchen.

Beispiel

Bearbeiten

In einer Urne befinden sich 45 Kugeln, 20 davon sind gelb. Wie hoch ist die Wahrscheinlichkeit, bei einer Stichprobe von zehn Kugeln genau vier gelbe Kugeln zu ziehen? Das Beispiel wird unten durchgerechnet.

Variablen

Bearbeiten

Die hypergeometrische Verteilung ist abhängig von drei Parametern:

  • der Anzahl   der Elemente einer Grundgesamtheit.
  • der Anzahl   der Elemente mit einer bestimmten Eigenschaft in dieser Grundmenge (die Anzahl möglicher Erfolge).
  • der Anzahl   der Elemente in einer Stichprobe.

Beschreibung des Zufallsexperiments

Bearbeiten

Die Verteilung gibt nun Auskunft darüber, wie wahrscheinlich es ist, dass sich   Elemente mit der zu prüfenden Eigenschaft (Erfolge bzw. Treffer) in der Stichprobe befinden. Der Ergebnisraum   ist daher  .


Berechnung der Wahrscheinlichkeit

Bearbeiten

Eine diskrete Zufallsgröße   unterliegt der hypergeometrischen Verteilung mit den Parametern  ,   und  , wenn sie die Wahrscheinlichkeiten

 

für   besitzt. Dabei bezeichnet   den BinomialkoeffizientenN über n“. Man schreibt dann   oder  .

Verteilungsfunktion

Bearbeiten

Die Verteilungsfunktion   gibt dann die Wahrscheinlichkeit an, dass höchstens   Elemente mit der zu prüfenden Eigenschaft in der Stichprobe sind. Diese kumulierte Wahrscheinlichkeit ist die Summe

 

Alternative Parametrisierung

Bearbeiten

Gelegentlich wird auch als Wahrscheinlichkeitsfunktion

 

verwendet. Diese geht mit   und   in die obige Variante über.

Eigenschaften der hypergeometrischen Verteilung

Bearbeiten

Symmetrien

Bearbeiten

Es gelten folgende Symmetrien:

  • Vertauschung von gezogenen Kugeln und Erfolgen:  
  • Vertauschung von Erfolgen und Misserfolgen:  

Erwartungswert

Bearbeiten

Der Erwartungswert der hypergeometrisch verteilten Zufallsvariable   ist

 

Der Modus der hypergeometrischen Verteilung ist

 

Dabei ist   die Gaußklammer.

Die Varianz der hypergeometrisch verteilten Zufallsvariable   ist

 

 

wobei der letzte Bruch der so genannte Korrekturfaktor (Endlichkeitskorrektur) beim Modell ohne Zurücklegen ist.

Die Schiefe der hypergeometrischen Verteilung ist

 

Charakteristische Funktion

Bearbeiten

Die charakteristische Funktion hat die folgende Form:

 

Wobei   die gaußsche hypergeometrische Funktion bezeichnet.

Momenterzeugende Funktion

Bearbeiten

Auch die momenterzeugende Funktion lässt sich mittels der hypergeometrischen Funktion ausdrücken:

 

Wahrscheinlichkeitserzeugende Funktion

Bearbeiten

Die wahrscheinlichkeitserzeugende Funktion ist gegeben als

 

Beziehung zu anderen Verteilungen

Bearbeiten

Beziehung zur Binomialverteilung

Bearbeiten

Im Gegensatz zur Binomialverteilung werden bei der hypergeometrischen Verteilung die Stichproben nicht wieder in das Reservoir zur erneuten Auswahl zurückgelegt. Ist der Umfang   der Stichprobe relativ klein (etwa  ) im Vergleich zum Umfang   der Grundgesamtheit, unterscheiden sich die durch die Binomialverteilung bzw. die hypergeometrische Verteilung berechneten Wahrscheinlichkeiten nicht wesentlich voneinander. In diesen Fällen wird dann oft die Approximation durch die mathematisch einfacher zu handhabende Binomialverteilung vorgenommen.

Beziehung zur Pólya-Verteilung

Bearbeiten

Die hypergeometrische Verteilung ist ein Spezialfall der Pólya-Verteilung (wähle  ).

Beziehung zum Urnenmodell

Bearbeiten

Die hypergeometrische Verteilung entsteht aus der diskreten Gleichverteilung durch das Urnenmodell. Aus einer Urne mit insgesamt   Kugeln sind   eingefärbt und es werden   Kugeln gezogen. Die hypergeometrische Verteilung gibt für   die Wahrscheinlichkeit an, dass   gefärbte Kugeln gezogen werden. Siehe hierzu auch das Beispiel.

Beziehung zur multivariaten hypergeometrischen Verteilung

Bearbeiten

Die multivariate hypergeometrische Verteilung ist eine Verallgemeinerung der hypergeometrischen Verteilung. Sie beantwortet die Frage nach der Anzahl der gezogenen Kugeln einer Farbe aus einer Urne, wenn diese mehr als zwei unterscheidbare Farben von Kugeln enthält. Für zwei Farben stimmt sie mit der hypergeometrischen Verteilung überein.

Beispiele

Bearbeiten

Diverse Beispiele

Bearbeiten

In einem Behälter befinden sich 45 Kugeln, davon sind 20 gelb.
Es werden 10 Kugeln ohne Zurücklegen entnommen.

Die hypergeometrische Verteilung gibt die Wahrscheinlichkeit dafür an, dass genau x = 0, 1, 2, 3, …, 10 der entnommenen Kugeln gelb sind.

Ein Beispiel für die praktische Anwendung der hypergeometrischen Verteilung ist das Lotto: Beim Zahlenlotto gibt es 49 nummerierte Kugeln; davon werden bei der Auslosung 6 gezogen; auf dem Lottoschein werden 6 Zahlen angekreuzt.

  gibt die Wahrscheinlichkeit dafür an, genau x = 0, 1, 2, 3, …, 6 „Treffer“ zu erzielen.

Also  .

Ausführliches Rechenbeispiel für die Kugeln (2)

Bearbeiten

Die Wahrscheinlichkeit ergibt sich aus:

Anzahl der Möglichkeiten, genau 4 gelbe (und damit genau 6 violette) Kugeln auszuwählen
geteilt durch
Anzahl der Möglichkeiten, genau 10 Kugeln beliebiger Farbe auszuwählen

Es gibt

 

Möglichkeiten, genau 4 gelbe Kugeln auszuwählen.

Ausführliches Rechenbeispiel für die Kugeln (3)

Bearbeiten

Es gibt

 

Möglichkeiten, genau 6 violette Kugeln auszuwählen.

Da jede „gelbe Möglichkeit“ mit jeder „violetten Möglichkeit“ kombiniert werden kann, ergeben sich

 

Möglichkeiten für genau 4 gelbe und 6 violette Kugeln.

Ausführliches Rechenbeispiel für die Kugeln (4)

Bearbeiten

Es gibt insgesamt

 

Möglichkeiten, 10 Kugeln zu ziehen.

Wir erhalten also die Wahrscheinlichkeit

 

das heißt, in rund 27 Prozent der Fälle werden genau 4 gelbe (und 6 violette) Kugeln entnommen.

Ausführliches Rechenbeispiel für die Kugeln (5)

Bearbeiten

Alternativ kann das Ergebnis auch mit folgender Gleichung gefunden werden

 

Es befinden sich in der Stichprobe vom Umfang   nämlich 4 gelbe Kugeln. Die restlichen gelben Kugeln (16) befinden sich in den 35 übriggebliebenen Kugeln, die nicht zur Stichprobe gehören.

Bearbeiten

   Wikibooks: Hypergeometrische Verteilung – Lern- und Lehrmaterialien

Einzelnachweise

Bearbeiten
  1. Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, S. 36, doi:10.1515/9783110215274

Seiten-Information

Bearbeiten

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Stochastik' erstellt der Link für die Wiki2Reveal-Folien] wurde mit dem Wiki2Reveal-Linkgenerator erstellt.

Diese Seite wurde auf Basis der folgenden Wikipedia-Quelle erstellt: