Kurs:Stochastik/Negative Binomialverteilung

Einführung (1)

Bearbeiten

Die negative Binomialverteilung (auch Pascal-Verteilung) ist eine univariate Wahrscheinlichkeitsverteilung. Sie zählt zu den diskreten Wahrscheinlichkeitsverteilungen und ist eine der drei Panjer-Verteilungen.

Sie beschreibt die Anzahl der Versuche, die erforderlich sind, um in einem Bernoulli-Prozess eine vorgegebene Anzahl von Erfolgen zu erzielen.

Neben der Poisson-Verteilung ist die negative Binomialverteilung die wichtigste Schadenzahlverteilung in der Versicherungsmathematik. Dort wird sie insbesondere als Schadenzahlverteilung in der Krankenversicherung benutzt, seltener im Bereich Kraftfahrzeug-Haftpflicht oder Kasko.

Herleitung der negativen Binomialverteilung (1)

Bearbeiten
 
Wahrscheinlichkeitsfunktion der negativen Binomialverteilung (Variante A) für  ;   (blau),   (grün) und   (rot)

Herleitung der negativen Binomialverteilung (2)

Bearbeiten

Man kann diese Verteilung mit Hilfe des Urnenmodells mit Zurücklegen beschreiben: In einer Urne befinden sich zwei Sorten Kugeln (dichotome Grundgesamtheit). Der Anteil der Kugeln erster Sorte beträgt  . Die Wahrscheinlichkeit, dass eine Kugel erster Sorte gezogen wird, beträgt also  .

Es wird nun so lange eine Kugel gezogen und wieder zurückgelegt, bis erstmals genau   Kugeln erster Sorte resultieren. Man kann eine Zufallsvariable  : „Zahl der Versuche, bis erstmals   Erfolge resultieren“ definieren. Die Zahl der Versuche liegt in der Menge  .   hat abzählbar unendlich viele mögliche Ausprägungen.

Herleitung der negativen Binomialverteilung (3)

Bearbeiten

Die Wahrscheinlichkeit, dass   Versuche nötig waren, um   Erfolge zu erzielen, also  , berechnet man nach folgender Überlegung:

Es sollen zum jetzigen Zeitpunkt bereits   Versuche stattgefunden haben. Es wurden insgesamt   Kugeln erster Sorte gezogen. Die Wahrscheinlichkeit dafür wird durch die Binomialverteilung der Zufallsvariablen  : „Zahl der Kugeln erster Sorte bei   Versuchen“ angegeben:

 

Herleitung der negativen Binomialverteilung (4)

Bearbeiten

Die Wahrscheinlichkeit, dass nun eine weitere Kugel erster Sorte gezogen wird, ist dann

 

Eine Zufallsvariable   heißt damit negativ binomialverteilt   mit den Parametern   (Anzahl der erfolgreichen Versuche) und   (Wahrscheinlichkeit des Eintretens eines Erfolges im Einzelversuch), wenn sich für sie die folgende Wahrscheinlichkeitsfunktion angeben lässt

 

Herleitung der negativen Binomialverteilung (5)

Bearbeiten

Diese Variante wird hier Variante A genannt, um Verwechslungen vorzubeugen.

Alternative Definition (1)

Bearbeiten

Eine diskrete Zufallsgröße   unterliegt der negativen Binomialverteilung   mit den Parametern   und  , wenn sie die Wahrscheinlichkeiten

 
            

für   besitzt.

Alternative Definition (2)

Bearbeiten

Beide Definitionen stehen über   in Beziehung; während die erste Definition also nach der Anzahl der Versuche   (erfolgreiche und erfolglose) bis zum Eintreten des  -ten Erfolgs fragt, interessiert sich die alternative Darstellung für die Anzahl   der Misserfolge bis zum Eintreten des  -ten Erfolgs. Dabei werden die   Erfolge nicht mitgezählt. Die Zufallsvariable   bezeichnet dann nur die Anzahl der misslungenen Versuche.

Diese Variante wird hier Variante B genannt.

Eigenschaften der negativen Binomialverteilung

Bearbeiten

Erwartungswert

Bearbeiten
Variante A

Der Erwartungswert bestimmt sich zu

 
Variante B

Bei der alternativen Definition ist der Erwartungswert um   kleiner, also

 

Die Varianz der negativen Binomialverteilung ist für beide Definitionen gegeben durch

 

Die Varianz ist bei der alternativen Definition immer größer als der Erwartungswert (Überdispersion).

Variationskoeffizient

Bearbeiten
Variante A

Aus Erwartungswert und Varianz ergibt sich sofort der Variationskoeffizient zu

 
Variante B

In der alternativen Darstellung ergibt sich

 

Charakteristische Funktion

Bearbeiten
Variante A

Die charakteristische Funktion hat die Form

 
Variante B

Alternativ ergibt sich

 

Wahrscheinlichkeitserzeugende Funktion

Bearbeiten
Variante A

Für die wahrscheinlichkeitserzeugende Funktion erhält man

  mit  
Variante B

Analog ist dann

 

Momenterzeugende Funktion

Bearbeiten
Variante A

Die momenterzeugende Funktion der negativen Binomialverteilung ist

  mit  
Variante B

Dann ist die Alternativdarstellung

 

Summen von negativ binomialverteilten Zufallsvariablen

Bearbeiten

Sind   zwei unabhängige negativ binomialverteilte Zufallsvariablen zu den Parametern   und  . Dann ist   wieder negativ binomialverteilt zum Parameter   und  . Die negative Binomialverteilung ist also reproduktiv, für die Faltung gilt

 

sie bildet eine Faltungshalbgruppe.

Verallgemeinerung auf reelle Parameter (1)

Bearbeiten

Die obige Herleitung und Interpretation der negativen Binomialverteilung über das Urnenmodell ist nur für   möglich. Es existiert jedoch auch eine Verallgemeinerung der negativen Binomialverteilung für  . Dazu wird eine Poisson-Verteilung   betrachtet, deren Intensität   zufällig gemäß einer Gamma-Verteilung mit den Parametern   und   verteilt ist. Wird nun die Mischverteilung dieser beiden Verteilungen gebildet, ergibt sich die sogenannte Poisson-Gamma-Verteilung. Für die Wahrscheinlichkeitsfunktion dieser Verteilung gilt dann

Verallgemeinerung auf reelle Parameter (2)

Bearbeiten

 

Verallgemeinerung auf reelle Parameter (3)

Bearbeiten

Für   ergibt sich gerade die Wahrscheinlichkeitsfunktion der negativen Binomialverteilung. Somit lässt sich die negative Binomialverteilung auch für   sinnvoll interpretieren. Die Wahrscheinlichkeit,   Erfolge zu erreichen, ist dann gleich der Wahrscheinlichkeit, bei einer Binomialverteilung mit zufälligem, gammaverteilten Parameter   Erfolge zu erreichen. Die Gamma-Funktionen in der Wahrscheinlichkeitsfunktion können auch durch verallgemeinerte Binomialkoeffizienten ersetzt werden.

Verallgemeinerung auf reelle Parameter (4)

Bearbeiten

Diese Konstruktion entspricht der oben definierten Variante B. Alle Charakteristika, wie Erwartungswert, Varianz und so weiter, bleiben unverändert gültig. Zudem ist die Variante für reelles   unendlich teilbar.

Beziehungen zu anderen Verteilungen

Bearbeiten

Beziehung zur geometrischen Verteilung

Bearbeiten

Die negative Binomialverteilung geht für   in die geometrische Verteilung über. Andererseits ist Summe   voneinander unabhängiger geometrisch verteilter Zufallsgrößen   mit demselben Parameter   negativ-binomialverteilt   mit den Parametern   und  . Allerdings ist auch hier zu beachten, welche Parametrisierungsvariante gewählt wurde.

Beziehung zur zusammengesetzten Poisson-Verteilung

Bearbeiten

Die negative Binomialverteilung entsteht aus der zusammengesetzten Poisson-Verteilung, wenn man diese mit der logarithmischen Verteilung kombiniert. Die Parameter gehen in die Variante B über mit   und  .

Beispiel (1)

Bearbeiten

Die Studentin Paula spielt heute Abend Skat. Aus langer Erfahrung weiß sie, dass sie bei jedem 5. Spiel gewinnt. Gewinnen ist folgendermaßen definiert: Sie muss zunächst ein Spiel durch Reizen bekommen, dann muss sie dieses Spiel gewinnen.

Da sie morgen um acht Uhr Statistik-Vorlesung hat, soll der Abend nicht zu lang werden. Deshalb hat sie beschlossen, nach dem 10. gewonnenen Spiel nach Hause zu gehen. Nehmen wir an, dass ein Spiel etwa 4 Minuten dauert (großzügig gerechnet). Mit welcher Wahrscheinlichkeit kann sie nach zwei Stunden nach Hause gehen, also nach 30 Spielen?

Beispiel (2)

Bearbeiten

Wir gehen mit unseren Überlegungen analog zu oben vor:

Mit welcher Wahrscheinlichkeit hat sie in 29 Spielen 9-mal gewonnen? Wir berechnen diese Wahrscheinlichkeit mit der Binomialverteilung, in Begriffen des Urnenmodells bei 29 Versuchen und 9 Kugeln erster Sorte:

 

Die Wahrscheinlichkeit, den 10. Gewinn beim 30. Spiel zu machen, ist nun

 

Beispiel (3)

Bearbeiten

Diese Wahrscheinlichkeit scheint nun sehr klein zu sein. Die Grafik der negativ binomialverteilten Zufallsvariablen   zeigt, dass insgesamt die Wahrscheinlichkeiten sehr klein bleiben. Wie soll da die arme Paula jemals ins Bett kommen? Wir können sie beruhigen: Es genügt ja, danach zu fragen, wie viele Versuche Paula höchstens braucht, es müssen ja nicht genau 30 sein.

Die Wahrscheinlichkeit, dass höchstens 30 Versuche nötig sind, ist die Verteilungsfunktion   der negativen Binomialverteilung an der Stelle  , was hier die Summe der Wahrscheinlichkeiten   ergibt.

Beispiel (4)

Bearbeiten

Ein Blick auf die Grafik der Verteilungsfunktion zeigt: Wenn Paula mit einer 50%igen Wahrscheinlichkeit zufrieden ist, müsste sie höchstens ca. 50 Spiele absolvieren, das wären 50·4 min = 200 min = 3h 20 min. Um mit einer 80%igen Wahrscheinlichkeit ihre 10 Gewinne zu bekommen, müsste sie höchstens ca. 70 Spiele spielen, also knapp 5 Stunden. Vielleicht sollte Paula doch ihre Strategie der Spielezahl ändern.

Bearbeiten

Literatur

Bearbeiten

Vorlage:Navigationsleiste Wahrscheinlichkeitsverteilungen

Seiten-Information

Bearbeiten

Diese Seite wurde auf Basis der folgenden Wikipedia-Quelle erstellt: