Kurs:Statistik für Anwender/Hilfsmittel: Punkt- und Intervallschätzung bei stetigen ZV

Hilfsmittel: Punkt- und Intervallschätzung bei stetigen ZV

Motivation I

In der Praxis ist die W-Dichte einer stetigen ZV ${\textstyle X}$ (analog zur Wahrscheinlichkeitsverteilung einer endlichen ZV) meist nicht bekannt. Manchmal können jedoch bestimmte Annahmen sinnvoll sein, wie etwa, welcher Verteilung ${\textstyle X}$ (näherungsweise) genügt.

Informationen über ${\textstyle X}$ liegen meist in Form einer Stichprobe von ${\textstyle n}$ unabhängig und unter gleichen Bedingungen erhaltenen Realisationen ${\textstyle x_{1},\ldots ,x_{n}}$ vor. Anhand dieser Daten kann man nun interessierende Kennwerte der ZV ${\textstyle X}$ schätzen.

Motivation II

ZV $X$ mit unbekannter W-Dichte ${\stackrel {\text{zufällig}}{\longrightarrow }}$ Daten $x_{1},\ldots ,x_{n}$

$\quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad {\stackrel {\text{methodisch}}{\longrightarrow }}$ Schätzung für unbekannte Parameter der ZV

Punktschätzungen - Schätzung für EW und Varianz

Sei ${\textstyle X}$ eine beliebige (diskrete oder stetige) ZV. Dabei sind der EW ${\textstyle E(X)}$ und die Varianz ${\textstyle V(X)}$ von ${\textstyle X}$ unbekannt.

${\textstyle E(X)}$ wird geschätzt durch: ${\textstyle \quad {\overline {x}}={\frac {1}{n}}\cdot \sum \limits _{j=1}^{n}x_{j}\quad }$ (arithmetischer Mittelwert)
${\textstyle V(X)}$ wird geschätzt durch: ${\textstyle \quad {s_{x}}^{2}={\frac {1}{n-1}}\cdot \sum \limits _{j=1}^{n}\left(x_{j}-{\overline {x}}\right)^{2}={\frac {1}{n-1}}\left(\sum \limits _{j=1}^{n}{x_{j}}^{2}-{\frac {1}{n}}\left(\sum \limits _{j=1}^{n}x_{j}\right)^{2}\right)}$
(empirische Varianz oder korrigierte Stichprobenvarianz)

Berechnung in R

In R berechnet man:
${\textstyle \quad {\overline {x}}\ {\text{mit}}\ }$ mean(x) und
${\textstyle \quad {s_{x}}^{2}\ {\text{mit}}\ }$ var(x) oder sd(x)^2

Erwartungstreue und Konsistenz

Diese beiden Schätzungen sind in jedem Fall erwartungstreu und konsistent:

Erwartungstreu

Die Ergebnisse der Schätzungen (also ${\textstyle {\overline {x}}}$ und ${\textstyle {s_{x}}^{2}}$ ) sind zwar vom Zufall abhängig, der erwartete Durchschnitt der Schätzung entspricht aber dem unbekannten zu schätzenden Wert (also ${\textstyle E(X)}$ bzw. ${\textstyle V(X)}$ ).

Präziser gesagt:
Vor Erhebung der Stichprobe können ${\textstyle {\overline {x}}\;{\hat {=}}\;M_{n}}$ und ${\textstyle {s_{x}}^{2}\;{\hat {=}}\;V_{n}}$ als ZV aufgefasst werden. Dann gilt:

{\textstyle \quad E\left(M_{n}\right)=E(X)\ {\text{und}}\ E\left(V_{n}\right)=V(X)}

Konsistent

Ist ${\textstyle n}$ sehr groß so sind die Schätzungen mit hoher Wahrscheinlichkeit nahe am wahren Wert. Also $n\ {\text{sehr groß}}\quad \Rightarrow$

\quad {\text{mit hoher Wahrscheinlichkeit ist}}\ {\overline {x}}\approx E(X)\ {\text{und}}\ {s_{x}}^{2}\approx V(X)

Präziser gesagt: Vor Erhebung der Stichprobe können ${\textstyle {\overline {x}}\;{\hat {=}}\;M_{n}}$ und ${\textstyle {s_{x}}^{2}\;{\hat {=}}\;V_{n}}$ als ZV aufgefasst werden. Dann gilt für festes ${\textstyle c>0}$ :
$P\left(E(X)-c\leq M_{n}\leq E(X)+c\right){\stackrel {n\to \infty }{\longrightarrow }}1$
und
$P\left(V(X)-c\leq V_{n}\leq V(X)+c\right){\stackrel {n\to \infty }{\longrightarrow }}1$

Beispiel zur Konsistenz I

Wir betrachten eine normalverteilte ZV mit ${\textstyle \sigma _{X}=15}$ und unbekanntem Erwartungswert ${\textstyle E(X)=\mu _{X}}$ . Dann ist der arithmetische Mittelwert ${\textstyle {\overline {x}}\;{\hat {=}}\;M_{n}}$ (als ZV aufgefasst) zu einer Stichprobe der Länge ${\textstyle n}$ ebenfalls normalverteilt (dies wollen wir hier nicht begründen) mit ${\textstyle \mu _{M_{n}}=\mu _{X}}$ und ${\textstyle \sigma _{M_{n}}={\frac {\sigma _{X}}{\sqrt {n}}}={\frac {15}{\sqrt {n}}}}$ . Daraus folgt:

Falls ${\textstyle n=20}$ ist, gilt: ${\begin{array}{lclcl}P\left(M_{n}\in [\mu -10,\mu +10]\right)&=&0.9971\\P\left(M_{n}\in [\mu -5,\mu +5]\right)&=&0.8640\\P\left(M_{n}\in [\mu -1,\mu +1]\right)&=&0.2344\\P\left(M_{n}\in [\mu -0.4,\mu +0.4]\right)&=&0.0949\\P\left(M_{n}\in [\mu -0.1,\mu +0.1]\right)&=&0.0238\end{array}}$

Beispiel zur Konsistenz II

Falls ${\textstyle n=150}$ ist, gilt: ${\begin{array}{lclcl}P\left(M_{n}\in [\mu -10,\mu +10]\right)&\approx &1\\P\left(M_{n}\in [\mu -5,\mu +5]\right)&\approx &1\\P\left(M_{n}\in [\mu -1,\mu +1]\right)&=&0.5858\\P\left(M_{n}\in [\mu -0.4,\mu +0.4]\right)&=&0.2560\\P\left(M_{n}\in [\mu -0.1,\mu +0.1]\right)&=&0.0651\end{array}}$

Beispiel zur Konsistenz III

Falls ${\textstyle n=1200}$ ist, gilt: ${\begin{array}{lclcl}P\left(M_{n}\in [\mu -10,\mu +10]\right)&\approx &1\\P\left(M_{n}\in [\mu -5,\mu +5]\right)&\approx &1\\P\left(M_{n}\in [\mu -1,\mu +1]\right)&=&0.9791\\P\left(M_{n}\in [\mu -0.4,\mu +0.4]\right)&=&0.6444\\P\left(M_{n}\in [\mu -0.1,\mu +0.1]\right)&=&0.1826\end{array}}$

Grundlagen der Intervallschätzung

Ziel ist es nun, auch Intervallschätzungen für unbekannte Parameter von stetigen ZV anzugeben. Dazu benötigen wir Kenntnisse über einige weitere Verteilungen ( ${\textstyle t}$ -Verteilung und ${\textstyle \chi ^{2}}$ -Verteilung), die üblicherweise nicht direkt als Modell für ein ZE verwendet werden. Sie treten aber bespielsweise auf, wenn man stetige ZV auf geeignete Art und Weise verknüpft und werden daher bei der Berechnung von Konfidenzintervallen für die Parameter dieser Verteilungen benötigt.

In diesem Abschnitt wollen wir diese Verteilungen definieren und ihre wichtigsten Eigenschaften zusammenfassen. Als weiteres Hilfsmittel brauchen wir dazu die Gamma-Funktion.

Gamma-Funktion

Definition Gamma-Funktion

Die Gamma-Funktion ist definiert durch: ${\textstyle \quad \Gamma :(0,\infty )\to \mathbb {R} ,\ \Gamma (x)=\int \limits _{0}^{\infty }t^{x-1}\cdot e^{-t}\ dt}$

Gamma-Funktion in R

In R berechnet man ${\textstyle \Gamma (x)}$ für ${\textstyle x\in (0,\infty )}$ durch gamma(x).

Werte der Gamma-Funktion auf den ganzen und halben Zahlen

Für alle ${\textstyle n\in \mathbb {N} \setminus \{0\}}$ gilt: ${\textstyle \quad \Gamma (n)=(n-1)!}$
Für alle ${\textstyle n\in \mathbb {N} }$ gilt: ${\textstyle \quad \Gamma \left(n+{\frac {1}{2}}\right)={\frac {(2n)!}{n!\cdot 4^{n}}}\cdot {\sqrt {\pi }}}$

Beispiel zur Gamma-Funktion

Es gilt:
${\begin{array}{|ccr|ccc|}\hline \Gamma \left({\frac {1}{2}}\right)&=&{\sqrt {\pi }}&\Gamma (1)&=&1\\\Gamma \left({\frac {3}{2}}\right)&=&{\frac {1}{2}}\cdot {\sqrt {\pi }}&\Gamma (2)&=&1\\\Gamma \left({\frac {5}{2}}\right)&=&{\frac {3}{4}}\cdot {\sqrt {\pi }}&\Gamma (3)&=&2\\\Gamma \left({\frac {7}{2}}\right)&=&{\frac {15}{8}}\cdot {\sqrt {\pi }}&\Gamma (4)&=&6\\\hline \end{array}}$

t-Verteilung

Definition t-Verteilung

Sei ${\textstyle k\in \mathbb {N} }$ gegeben.

Eine ZV ${\textstyle X}$ mit der W-Dichte $\quad f:\mathbb {R} \to [0,\infty ),\ f(t)={\frac {\Gamma \left({\frac {k+1}{2}}\right)}{{\sqrt {k\pi }}\cdot \Gamma \left({\frac {k}{2}}\right)}}\cdot \left(1+{\frac {t^{2}}{k}}\right)^{-{\frac {k+1}{2}}}$
heißt ${\textstyle t}$ -verteilt mit ${\textstyle k}$ Freiheitsgraden (FG).

Verteilungsfunktion einer t-Verteilung

Die Verteilungsfunktion einer ${\textstyle t}$ -verteilten ZV mit ${\textstyle k}$ FG bezeichnen wir mit ${\textstyle T_{k}}$ : $T_{k}(x)=\int \limits _{-\infty }^{x}f(t)\ dt={\frac {\Gamma \left({\frac {k+1}{2}}\right)}{{\sqrt {k\pi }}\cdot \Gamma \left({\frac {k}{2}}\right)}}\cdot \int \limits _{-\infty }^{x}\left(1+{\frac {x^{2}}{k}}\right)^{-{\frac {k+1}{2}}}\ dt$

Beispiel t-Verteilung

Beispiel t-Verteilung interaktiv

Interaktive Shiny-App zur t-Verteilung:
Download und Link

t-Verteilung und Normalverteilung

Für große $k$ nähert sich die ${\textstyle t}$ -Verteilung einer Standardnormalverteilung an (also ${\textstyle T_{k}(x)\approx \Phi (x)}$ für große ${\textstyle k}$ ).

t-Verteilung in R

Für eine $t$ -verteilte ZV ${\textstyle X}$ mit ${\textstyle k}$ FG berechnet man in R:

die Funktionswerte der W-Dichte von ${\textstyle X}$ durch: ${\textstyle f(t)=\color {blue}{dt(t,k)}}$
die Funktionswerte der VF von ${\textstyle X}$ durch: ${\textstyle T_{n}(x)=\color {blue}{pt(x,k)}}$
die Wahrscheinlichkeit für ${\textstyle X\in [u,v]}$ durch: ${\textstyle P(u\leq X\leq v)=\color {blue}{pt(v,k)-pt(u,k)}}$
für ${\textstyle q\in ]0,1[}$ die Zahl ${\textstyle x\in \mathbb {R} }$ mit ${\textstyle T_{k}(x)=q}$ durch: ${\textstyle x=\color {blue}{qt(q,k)}}$

Χ²-Verteilung

Definition Χ²-Verteilung

Sei ${\textstyle k\in \mathbb {N} }$ gegeben.

Eine ZV ${\textstyle X}$ mit der W-Dichte
${\textstyle \quad f:\mathbb {R} \to [0,\infty ),\ f(t)=\left\{{\begin{array}{ccl}{\frac {1}{2^{\frac {k}{2}}\cdot \Gamma \left({\frac {k}{2}}\right)}}\cdot t^{\left({\frac {k}{2}}-1\right)}\cdot e^{\frac {t}{2}}&,&{\text{falls}}\ t>0\\0&,&{\text{falls}}\ t\leq 0\end{array}}\right.}$
heißt Χ² -verteilt mit ${\textstyle k}$ Freiheitsgraden (FG).

Verteilungsfunktion Χ²-Verteilung

Die Verteilungsfunktion einer ${\textstyle \chi ^{2}}$ -verteilten ZV mit ${\textstyle k}$ FG bezeichnen wir mit ${\textstyle S_{k}}$ :

für ${\textstyle x\leq 0}$ : ${\textstyle \quad S_{k}(x)=\int \limits _{-\infty }^{x}0\ dt=0}$
für ${\textstyle x>0}$ : ${\textstyle \quad S_{k}(x)=\int \limits _{-\infty }^{x}f(t)\ dt={\frac {1}{2^{\frac {k}{2}}\cdot \Gamma \left({\frac {k}{2}}\right)}}\cdot \int \limits _{0}^{x}t^{\left({\frac {k}{2}}-1\right)}\cdot e^{\frac {t}{2}}\ dt}$

Beispiel Χ²-Verteilung

Beispiel Χ²-Verteilung interaktiv

Interaktive Shiny-App zur Chi-Quadrat-Verteilung:
Download und Link

Χ²-Verteilung in R

Für eine $\chi ^{2}$ -verteilte ZV $X$ mit $k$ FG berechnet man in R:

die Funktionswerte der W-Dichte von ${\textstyle X}$ durch: ${\textstyle f(t)=\color {blue}{dchisq(t,k)}}$
die Funktionswerte der VF von ${\textstyle X}$ durch: ${\textstyle T_{n}(x)=\color {blue}{pchisq(x,k)}}$
die Wahrscheinlichkeit für ${\textstyle X\in [u,v]}$ durch: ${\textstyle P(u\leq X\leq v)=\color {blue}{pchisq(v,k)-pchisq(u,k)}}$
für ${\textstyle q\in ]0,1[}$ die Zahl ${\textstyle x\in \mathbb {R} }$ mit ${\textstyle T_{k}(x)=q}$ durch: ${\textstyle x=\color {blue}{qchisq(q,k)}}$

Seiteninformation

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.

Die Seite wurde als Dokumententyp PanDocElectron-SLIDE erstellt.
Link zur Quelle in Wikiversity: https://de.wikiversity.org/wiki/Kurs:Statistik%20f%C3%BCr%20Anwender/Hilfsmittel:%20Punkt-%20und%20Intervallsch%C3%A4tzung%20bei%20stetigen%20ZV
siehe auch weitere Informationen zu Wiki2Reveal und unter Wiki2Reveal-Linkgenerator.