In der Praxis ist die W-Dichte einer stetigen ZV
X
{\textstyle X}
(analog zur Wahrscheinlichkeitsverteilung einer endlichen ZV) meist nicht bekannt. Manchmal können jedoch bestimmte Annahmen sinnvoll sein, wie etwa, welcher Verteilung
X
{\textstyle X}
(näherungsweise) genügt.
Informationen über
X
{\textstyle X}
liegen meist in Form einer Stichprobe von
n
{\textstyle n}
unabhängig und unter gleichen Bedingungen erhaltenen Realisationen
x
1
,
…
,
x
n
{\textstyle x_{1},\ldots ,x_{n}}
vor. Anhand dieser Daten kann man nun interessierende Kennwerte der ZV
X
{\textstyle X}
schätzen.
ZV
X
{\displaystyle X}
mit unbekannter W-Dichte
⟶
zufällig
{\displaystyle {\stackrel {\text{zufällig}}{\longrightarrow }}}
Daten
x
1
,
…
,
x
n
{\displaystyle x_{1},\ldots ,x_{n}}
⟶
methodisch
{\displaystyle \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad {\stackrel {\text{methodisch}}{\longrightarrow }}}
Schätzung für unbekannte Parameter der ZV
Punktschätzungen - Schätzung für EW und Varianz
Bearbeiten
Sei
X
{\textstyle X}
eine beliebige (diskrete oder stetige) ZV. Dabei sind der EW
E
(
X
)
{\textstyle E(X)}
und die Varianz
V
(
X
)
{\textstyle V(X)}
von
X
{\textstyle X}
unbekannt.
E
(
X
)
{\textstyle E(X)}
wird geschätzt durch:
x
¯
=
1
n
⋅
∑
j
=
1
n
x
j
{\textstyle \quad {\overline {x}}={\frac {1}{n}}\cdot \sum \limits _{j=1}^{n}x_{j}\quad }
(arithmetischer Mittelwert)
V
(
X
)
{\textstyle V(X)}
wird geschätzt durch:
s
x
2
=
1
n
−
1
⋅
∑
j
=
1
n
(
x
j
−
x
¯
)
2
=
1
n
−
1
(
∑
j
=
1
n
x
j
2
−
1
n
(
∑
j
=
1
n
x
j
)
2
)
{\textstyle \quad {s_{x}}^{2}={\frac {1}{n-1}}\cdot \sum \limits _{j=1}^{n}\left(x_{j}-{\overline {x}}\right)^{2}={\frac {1}{n-1}}\left(\sum \limits _{j=1}^{n}{x_{j}}^{2}-{\frac {1}{n}}\left(\sum \limits _{j=1}^{n}x_{j}\right)^{2}\right)}
(empirische Varianz oder korrigierte Stichprobenvarianz )
In R berechnet man:
x
¯
mit
{\textstyle \quad {\overline {x}}\ {\text{mit}}\ }
mean(x) und
s
x
2
mit
{\textstyle \quad {s_{x}}^{2}\ {\text{mit}}\ }
var(x) oder sd(x)^2
Diese beiden Schätzungen sind in jedem Fall erwartungstreu und konsistent :
Die Ergebnisse der Schätzungen (also
x
¯
{\textstyle {\overline {x}}}
und
s
x
2
{\textstyle {s_{x}}^{2}}
) sind zwar vom Zufall abhängig, der erwartete Durchschnitt der Schätzung entspricht aber dem unbekannten zu schätzenden Wert (also
E
(
X
)
{\textstyle E(X)}
bzw.
V
(
X
)
{\textstyle V(X)}
).
Präziser gesagt:
Vor Erhebung der Stichprobe können
x
¯
=
^
M
n
{\textstyle {\overline {x}}\;{\hat {=}}\;M_{n}}
und
s
x
2
=
^
V
n
{\textstyle {s_{x}}^{2}\;{\hat {=}}\;V_{n}}
als ZV aufgefasst werden. Dann gilt:
E
(
M
n
)
=
E
(
X
)
und
E
(
V
n
)
=
V
(
X
)
{\textstyle \quad E\left(M_{n}\right)=E(X)\ {\text{und}}\ E\left(V_{n}\right)=V(X)}
Ist
n
{\textstyle n}
sehr groß so sind die Schätzungen mit hoher Wahrscheinlichkeit nahe am wahren Wert. Also
n
sehr groß
⇒
{\displaystyle n\ {\text{sehr groß}}\quad \Rightarrow }
mit hoher Wahrscheinlichkeit ist
x
¯
≈
E
(
X
)
und
s
x
2
≈
V
(
X
)
{\displaystyle \quad {\text{mit hoher Wahrscheinlichkeit ist}}\ {\overline {x}}\approx E(X)\ {\text{und}}\ {s_{x}}^{2}\approx V(X)}
Präziser gesagt: Vor Erhebung der Stichprobe können
x
¯
=
^
M
n
{\textstyle {\overline {x}}\;{\hat {=}}\;M_{n}}
und
s
x
2
=
^
V
n
{\textstyle {s_{x}}^{2}\;{\hat {=}}\;V_{n}}
als ZV aufgefasst werden. Dann gilt für festes
c
>
0
{\textstyle c>0}
:
P
(
E
(
X
)
−
c
≤
M
n
≤
E
(
X
)
+
c
)
⟶
n
→
∞
1
{\displaystyle P\left(E(X)-c\leq M_{n}\leq E(X)+c\right){\stackrel {n\to \infty }{\longrightarrow }}1}
und
P
(
V
(
X
)
−
c
≤
V
n
≤
V
(
X
)
+
c
)
⟶
n
→
∞
1
{\displaystyle P\left(V(X)-c\leq V_{n}\leq V(X)+c\right){\stackrel {n\to \infty }{\longrightarrow }}1}
Wir betrachten eine normalverteilte ZV mit
σ
X
=
15
{\textstyle \sigma _{X}=15}
und unbekanntem Erwartungswert
E
(
X
)
=
μ
X
{\textstyle E(X)=\mu _{X}}
. Dann ist der arithmetische Mittelwert
x
¯
=
^
M
n
{\textstyle {\overline {x}}\;{\hat {=}}\;M_{n}}
(als ZV aufgefasst) zu einer Stichprobe der Länge
n
{\textstyle n}
ebenfalls normalverteilt (dies wollen wir hier nicht begründen) mit
μ
M
n
=
μ
X
{\textstyle \mu _{M_{n}}=\mu _{X}}
und
σ
M
n
=
σ
X
n
=
15
n
{\textstyle \sigma _{M_{n}}={\frac {\sigma _{X}}{\sqrt {n}}}={\frac {15}{\sqrt {n}}}}
. Daraus folgt:
Falls
n
=
20
{\textstyle n=20}
ist, gilt:
P
(
M
n
∈
[
μ
−
10
,
μ
+
10
]
)
=
0.9971
P
(
M
n
∈
[
μ
−
5
,
μ
+
5
]
)
=
0.8640
P
(
M
n
∈
[
μ
−
1
,
μ
+
1
]
)
=
0.2344
P
(
M
n
∈
[
μ
−
0.4
,
μ
+
0.4
]
)
=
0.0949
P
(
M
n
∈
[
μ
−
0.1
,
μ
+
0.1
]
)
=
0.0238
{\displaystyle {\begin{array}{lclcl}P\left(M_{n}\in [\mu -10,\mu +10]\right)&=&0.9971\\P\left(M_{n}\in [\mu -5,\mu +5]\right)&=&0.8640\\P\left(M_{n}\in [\mu -1,\mu +1]\right)&=&0.2344\\P\left(M_{n}\in [\mu -0.4,\mu +0.4]\right)&=&0.0949\\P\left(M_{n}\in [\mu -0.1,\mu +0.1]\right)&=&0.0238\end{array}}}
Falls
n
=
150
{\textstyle n=150}
ist, gilt:
P
(
M
n
∈
[
μ
−
10
,
μ
+
10
]
)
≈
1
P
(
M
n
∈
[
μ
−
5
,
μ
+
5
]
)
≈
1
P
(
M
n
∈
[
μ
−
1
,
μ
+
1
]
)
=
0.5858
P
(
M
n
∈
[
μ
−
0.4
,
μ
+
0.4
]
)
=
0.2560
P
(
M
n
∈
[
μ
−
0.1
,
μ
+
0.1
]
)
=
0.0651
{\displaystyle {\begin{array}{lclcl}P\left(M_{n}\in [\mu -10,\mu +10]\right)&\approx &1\\P\left(M_{n}\in [\mu -5,\mu +5]\right)&\approx &1\\P\left(M_{n}\in [\mu -1,\mu +1]\right)&=&0.5858\\P\left(M_{n}\in [\mu -0.4,\mu +0.4]\right)&=&0.2560\\P\left(M_{n}\in [\mu -0.1,\mu +0.1]\right)&=&0.0651\end{array}}}
Falls
n
=
1200
{\textstyle n=1200}
ist, gilt:
P
(
M
n
∈
[
μ
−
10
,
μ
+
10
]
)
≈
1
P
(
M
n
∈
[
μ
−
5
,
μ
+
5
]
)
≈
1
P
(
M
n
∈
[
μ
−
1
,
μ
+
1
]
)
=
0.9791
P
(
M
n
∈
[
μ
−
0.4
,
μ
+
0.4
]
)
=
0.6444
P
(
M
n
∈
[
μ
−
0.1
,
μ
+
0.1
]
)
=
0.1826
{\displaystyle {\begin{array}{lclcl}P\left(M_{n}\in [\mu -10,\mu +10]\right)&\approx &1\\P\left(M_{n}\in [\mu -5,\mu +5]\right)&\approx &1\\P\left(M_{n}\in [\mu -1,\mu +1]\right)&=&0.9791\\P\left(M_{n}\in [\mu -0.4,\mu +0.4]\right)&=&0.6444\\P\left(M_{n}\in [\mu -0.1,\mu +0.1]\right)&=&0.1826\end{array}}}
Ziel ist es nun, auch Intervallschätzungen für unbekannte Parameter von stetigen ZV anzugeben. Dazu benötigen wir Kenntnisse über einige weitere Verteilungen (
t
{\textstyle t}
-Verteilung und
χ
2
{\textstyle \chi ^{2}}
-Verteilung), die üblicherweise nicht direkt als Modell für ein ZE verwendet werden. Sie treten aber bespielsweise auf, wenn man stetige ZV auf geeignete Art und Weise verknüpft und werden daher bei der Berechnung von Konfidenzintervallen für die Parameter dieser Verteilungen benötigt.
In diesem Abschnitt wollen wir diese Verteilungen definieren und ihre wichtigsten Eigenschaften zusammenfassen. Als weiteres Hilfsmittel brauchen wir dazu die Gamma-Funktion.
Die Gamma-Funktion ist definiert durch:
Γ
:
(
0
,
∞
)
→
R
,
Γ
(
x
)
=
∫
0
∞
t
x
−
1
⋅
e
−
t
d
t
{\textstyle \quad \Gamma :(0,\infty )\to \mathbb {R} ,\ \Gamma (x)=\int \limits _{0}^{\infty }t^{x-1}\cdot e^{-t}\ dt}
In R berechnet man
Γ
(
x
)
{\textstyle \Gamma (x)}
für
x
∈
(
0
,
∞
)
{\textstyle x\in (0,\infty )}
durch gamma(x) .
Werte der Gamma-Funktion auf den ganzen und halben Zahlen
Bearbeiten
Für alle
n
∈
N
∖
{
0
}
{\textstyle n\in \mathbb {N} \setminus \{0\}}
gilt:
Γ
(
n
)
=
(
n
−
1
)
!
{\textstyle \quad \Gamma (n)=(n-1)!}
Für alle
n
∈
N
{\textstyle n\in \mathbb {N} }
gilt:
Γ
(
n
+
1
2
)
=
(
2
n
)
!
n
!
⋅
4
n
⋅
π
{\textstyle \quad \Gamma \left(n+{\frac {1}{2}}\right)={\frac {(2n)!}{n!\cdot 4^{n}}}\cdot {\sqrt {\pi }}}
Es gilt:
Γ
(
1
2
)
=
π
Γ
(
1
)
=
1
Γ
(
3
2
)
=
1
2
⋅
π
Γ
(
2
)
=
1
Γ
(
5
2
)
=
3
4
⋅
π
Γ
(
3
)
=
2
Γ
(
7
2
)
=
15
8
⋅
π
Γ
(
4
)
=
6
{\displaystyle {\begin{array}{|ccr|ccc|}\hline \Gamma \left({\frac {1}{2}}\right)&=&{\sqrt {\pi }}&\Gamma (1)&=&1\\\Gamma \left({\frac {3}{2}}\right)&=&{\frac {1}{2}}\cdot {\sqrt {\pi }}&\Gamma (2)&=&1\\\Gamma \left({\frac {5}{2}}\right)&=&{\frac {3}{4}}\cdot {\sqrt {\pi }}&\Gamma (3)&=&2\\\Gamma \left({\frac {7}{2}}\right)&=&{\frac {15}{8}}\cdot {\sqrt {\pi }}&\Gamma (4)&=&6\\\hline \end{array}}}
Sei
k
∈
N
{\textstyle k\in \mathbb {N} }
gegeben.
Eine ZV
X
{\textstyle X}
mit der W-Dichte
f
:
R
→
[
0
,
∞
)
,
f
(
t
)
=
Γ
(
k
+
1
2
)
k
π
⋅
Γ
(
k
2
)
⋅
(
1
+
t
2
k
)
−
k
+
1
2
{\displaystyle \quad f:\mathbb {R} \to [0,\infty ),\ f(t)={\frac {\Gamma \left({\frac {k+1}{2}}\right)}{{\sqrt {k\pi }}\cdot \Gamma \left({\frac {k}{2}}\right)}}\cdot \left(1+{\frac {t^{2}}{k}}\right)^{-{\frac {k+1}{2}}}}
heißt
t
{\textstyle t}
-verteilt mit
k
{\textstyle k}
Freiheitsgraden (FG) .
Die Verteilungsfunktion einer
t
{\textstyle t}
-verteilten ZV mit
k
{\textstyle k}
FG bezeichnen wir mit
T
k
{\textstyle T_{k}}
:
T
k
(
x
)
=
∫
−
∞
x
f
(
t
)
d
t
=
Γ
(
k
+
1
2
)
k
π
⋅
Γ
(
k
2
)
⋅
∫
−
∞
x
(
1
+
x
2
k
)
−
k
+
1
2
d
t
{\displaystyle T_{k}(x)=\int \limits _{-\infty }^{x}f(t)\ dt={\frac {\Gamma \left({\frac {k+1}{2}}\right)}{{\sqrt {k\pi }}\cdot \Gamma \left({\frac {k}{2}}\right)}}\cdot \int \limits _{-\infty }^{x}\left(1+{\frac {x^{2}}{k}}\right)^{-{\frac {k+1}{2}}}\ dt}
Interaktive Shiny-App zur t-Verteilung:
Download und Link
Für große
k
{\displaystyle k}
nähert sich die
t
{\textstyle t}
-Verteilung einer Standardnormalverteilung an (also
T
k
(
x
)
≈
Φ
(
x
)
{\textstyle T_{k}(x)\approx \Phi (x)}
für große
k
{\textstyle k}
).
Für eine
t
{\displaystyle t}
-verteilte ZV
X
{\textstyle X}
mit
k
{\textstyle k}
FG berechnet man in
R :
die Funktionswerte der W-Dichte von
X
{\textstyle X}
durch:
f
(
t
)
=
d
t
(
t
,
k
)
{\textstyle f(t)=\color {blue}{dt(t,k)}}
die Funktionswerte der VF von
X
{\textstyle X}
durch:
T
n
(
x
)
=
p
t
(
x
,
k
)
{\textstyle T_{n}(x)=\color {blue}{pt(x,k)}}
die Wahrscheinlichkeit für
X
∈
[
u
,
v
]
{\textstyle X\in [u,v]}
durch:
P
(
u
≤
X
≤
v
)
=
p
t
(
v
,
k
)
−
p
t
(
u
,
k
)
{\textstyle P(u\leq X\leq v)=\color {blue}{pt(v,k)-pt(u,k)}}
für
q
∈
]
0
,
1
[
{\textstyle q\in ]0,1[}
die Zahl
x
∈
R
{\textstyle x\in \mathbb {R} }
mit
T
k
(
x
)
=
q
{\textstyle T_{k}(x)=q}
durch:
x
=
q
t
(
q
,
k
)
{\textstyle x=\color {blue}{qt(q,k)}}
Sei
k
∈
N
{\textstyle k\in \mathbb {N} }
gegeben.
Eine ZV
X
{\textstyle X}
mit der W-Dichte
f
:
R
→
[
0
,
∞
)
,
f
(
t
)
=
{
1
2
k
2
⋅
Γ
(
k
2
)
⋅
t
(
k
2
−
1
)
⋅
e
t
2
,
falls
t
>
0
0
,
falls
t
≤
0
{\textstyle \quad f:\mathbb {R} \to [0,\infty ),\ f(t)=\left\{{\begin{array}{ccl}{\frac {1}{2^{\frac {k}{2}}\cdot \Gamma \left({\frac {k}{2}}\right)}}\cdot t^{\left({\frac {k}{2}}-1\right)}\cdot e^{\frac {t}{2}}&,&{\text{falls}}\ t>0\\0&,&{\text{falls}}\ t\leq 0\end{array}}\right.}
heißt Χ2 -verteilt mit
k
{\textstyle k}
Freiheitsgraden (FG) .
Die Verteilungsfunktion einer
χ
2
{\textstyle \chi ^{2}}
-verteilten ZV mit
k
{\textstyle k}
FG bezeichnen wir mit
S
k
{\textstyle S_{k}}
:
Interaktive Shiny-App zur Chi-Quadrat-Verteilung:
Download und Link
Für eine
χ
2
{\displaystyle \chi ^{2}}
-verteilte ZV
X
{\displaystyle X}
mit
k
{\displaystyle k}
FG berechnet man in R :
die Funktionswerte der W-Dichte von
X
{\textstyle X}
durch:
f
(
t
)
=
d
c
h
i
s
q
(
t
,
k
)
{\textstyle f(t)=\color {blue}{dchisq(t,k)}}
die Funktionswerte der VF von
X
{\textstyle X}
durch:
T
n
(
x
)
=
p
c
h
i
s
q
(
x
,
k
)
{\textstyle T_{n}(x)=\color {blue}{pchisq(x,k)}}
die Wahrscheinlichkeit für
X
∈
[
u
,
v
]
{\textstyle X\in [u,v]}
durch:
P
(
u
≤
X
≤
v
)
=
p
c
h
i
s
q
(
v
,
k
)
−
p
c
h
i
s
q
(
u
,
k
)
{\textstyle P(u\leq X\leq v)=\color {blue}{pchisq(v,k)-pchisq(u,k)}}
für
q
∈
]
0
,
1
[
{\textstyle q\in ]0,1[}
die Zahl
x
∈
R
{\textstyle x\in \mathbb {R} }
mit
T
k
(
x
)
=
q
{\textstyle T_{k}(x)=q}
durch:
x
=
q
c
h
i
s
q
(
q
,
k
)
{\textstyle x=\color {blue}{qchisq(q,k)}}