Kurs:Statistik für Anwender/Darstellung und Korrelation für mehrere Merkmale

Darstellung und Korrelation für (zwei) mehrere Merkmale Bearbeiten

In diesem Abschnitt betrachten wir stets zwei Merkmale ${\textstyle X:\Omega \to A}$ und ${\textstyle Y:\Omega \to B}$ auf derselben Grundgesamtheit ${\textstyle \Omega }$ (man spricht dann von verbundenen Merkmalen). Oft stellt sich die Frage, ob die Merkmale voneinander abhängig sind, das heißt, ob gewisse Werte für ${\textstyle X(\omega )}$ mit gewissen anderen Werte für ${\textstyle Y(\omega )}$ mehr bzw. weniger gehäuft auftreten. Wir wollen nun einige (gemeinsame) Darstellungsformen für zwei verbundene Merkmale angeben und Methoden behandeln, mit denen man ihre Abhängigkeit untersuchen kann.

Verbundene Merkmale Bearbeiten

Ist ${\textstyle \Omega =\{\omega _{1},\ \ldots ,\omega _{n}\}}$ eine Grundgesamtheit und sind ${\textstyle X:\Omega \to A}$ und ${\textstyle Y:\Omega \to B}$ verbundene Merkmale, so bezeichnet man die Abbildung

{\big (}X,Y{\big )}:\Omega \to A\times B,\ \omega \mapsto {\big (}X(\omega ),Y(\omega ){\big )}

als zweidimensionales Merkmal. Ein Wertepaar

{\textstyle {\big (}X(\omega _{i}),Y(\omega _{i}){\big )}\ (i=1,\ldots ,n)}

heißt Beobachtungswert.

Beispiel verbundene Merkmale Bearbeiten

Gibt ${\textstyle X}$ die Größe und ${\textstyle Y}$ das Gewicht einer Person an, so wird man erwarten, dass bei einem hohen Wert ${\textstyle X(\omega )}$ auch eher ein hoher Wert für ${\textstyle Y(\omega )}$ auftritt.
Ist ${\textstyle X}$ die Regenmenge (für bestimmte Tage im Sommer) und ${\textstyle Y}$ die Durchschnittstemperatur, so lässt sich (vermutlich) ein umgekehrter Zusammenhang erwarten (eine hohe Regenmenge entspricht eher einer niedrigen Temperatur).
Falls ${\textstyle X}$ die Größe einer Person und ${\textstyle Y}$ die Punktzahl in einer Mathematik-Klausur beschreibt, so erwartet man, dass die Beobachtungswerte unabhängig voneinander sind (von Zufälligigkeiten abgesehen).

Urliste Bearbeiten

Als Urliste bezeichnet man die Tabelle

{\begin{array}{|c|c|c|c|}\hline \omega _{i}&\omega _{1}&\ldots &\omega _{n}\\\hline {\text{X(}}\omega _{i})&{\text{X(}}\omega _{1})&\ldots &{\text{X(}}\omega _{n})\\\hline {\text{Y(}}\omega _{i})&{\text{Y(}}\omega _{1})&\ldots &{\text{Y(}}\omega _{n})\\\hline \end{array}}

beziehungsweise die Auflistung aller Paare von Beobachtungswerten

{\big (}X(\omega _{1}),Y(\omega _{1}){\big )},\ {\big (}X(\omega _{2}),Y(\omega _{2}){\big )},\ \ldots ,\ {\big (}X(\omega _{n}),Y(\omega _{n}){\big )}.

als Urliste.

Wir schreiben im Folgenden auch kurz ${\textstyle x_{i}=X(\omega _{i})}$ und ${\textstyle y_{i}=Y(\omega _{i})}$ .

Beispiel Urliste bei verbundenem Merkmal Bearbeiten

Auf einem Bauernhof werden Hühnereier in Güteklassen (A,B und C) und Gewichtsklassen (S,M,L,XL) eingeteilt. Eine Serie von ${\textstyle 500}$ Eiern wird diesbezüglich statistisch erfasst. Auf der Grundgesamtheit ${\textstyle \Omega =\left\{\omega _{1},\omega _{2},\ldots ,\omega _{500}\right\}}$ haben wir also die Merkmale

X:\Omega \to \left\{{\text{A,B,C}}\right\}\ ({\text{Güte}})\quad {\text{und}}\quad Y:\Omega \to \left\{{\text{S,M,L,XL}}\right\}\ ({\text{Gewicht}})

Die Urliste könnte nun wie folgt aussehen:

{\begin{array}{|c|c|c|c|c|c|c|c|c|}\hline \omega &\omega _{1}&\omega _{2}&\omega _{3}&\omega _{4}&\omega _{5}&\ldots &\omega _{499}&\omega _{500}\\\hline {\text{X(}}\omega )&{\text{A}}&{\text{A}}&{\text{C}}&{\text{B}}&{\text{C}}&\ldots &{\text{B}}&{\text{A}}\\\hline {\text{Y(}}\omega )&{\text{XL}}&{\text{L}}&{\text{L}}&{\text{S}}&{\text{M}}&\ldots &{\text{M}}&{\text{L}}\\\hline \end{array}}

Kontingenztabellen Bearbeiten

Gemeinsame absolute und relative Häufigkeit Bearbeiten

Sind ${\textstyle X,Y:\Omega \to \mathbb {R} }$ verbundene Merkmale auf einer Grundgesamtheit ${\textstyle \Omega }$ mit den Merkmalsräumen ${\textstyle A=\{a_{1},\ldots ,a_{m}\}}$ (für ${\textstyle X}$ ) und ${\textstyle B=\{b_{1},\ldots ,b_{\ell }\}}$ (für ${\textstyle Y}$ ), so kann man wie zuvor auch die absoluten und relativen Häufigkeiten der beiden einzelnen Merkmale erfassen. An ihnen kann man aber keine Abhängigkeiten der beiden Merkmale feststellen. Man betrachtet daher die gemeinsamen absoluten bzw. relativen Häufigkeiten. Für ${\textstyle i=1,\ldots ,m}$ und ${\textstyle j=1,\ldots ,l}$ bezeichnet man

h_{i,j}=h(a_{i},b_{j})=\left|\{\omega \in \Omega ;\ {\big (}X(\omega ),Y(\omega ){\big )}=(a_{i},b_{j})\}\right|

als absolute Häufigkeit von

{\textstyle (a_{i},b_{j})}

und

r_{i,j}=r(a_{i},b_{j})={\frac {h_{i,j}}{|\Omega |}}

als relative Häufigkeit von

{\textstyle (a_{i},b_{j})}

.

Kontingenztabelle Bearbeiten

Die Tabellen mit diesen Werten

{\begin{array}{|cc||c|c|c|c|}\hline &Y&b_{1}&b_{2}&\ldots &b_{l}\\X&&&&&\\\hline \hline a_{1}&&h(a_{1},b_{1})&h(a_{1},b_{2})&\ldots &h(a_{1},b_{\ell })\\\hline a_{2}&&h(a_{2},b_{1})&h(a_{2},b_{2})&\ldots &h(a_{2},b_{\ell })\\\hline \vdots &&\vdots &\vdots &\ddots &\vdots \\\hline a_{m}&&h(a_{m},b_{1})&h(a_{m},b_{2})&\ldots &h(a_{m},b_{\ell })\\\hline \end{array}}\quad \quad {\begin{array}{|cc||c|c|c|c|}\hline &Y&b_{1}&b_{2}&\ldots &b_{\ell }\\X&&&&&\\\hline \hline a_{1}&&r(a_{1},b_{1})&r(a_{1},b_{2})&\ldots &r(a_{1},b_{\ell })\\\hline a_{2}&&r(a_{2},b_{1})&r(a_{2},b_{2})&\ldots &r(a_{2},b_{\ell })\\\hline \vdots &&\vdots &\vdots &\ddots &\vdots \\\hline a_{m}&&r(a_{m},b_{1})&r(a_{m},b_{2})&\ldots &r(a_{m},b_{\ell })\\\hline \end{array}}

Kurs:Statistik für Anwender/Darstellung und Korrelation für mehrere Merkmale

Darstellung und Korrelation für (zwei) mehrere Merkmale Bearbeiten

Verbundene Merkmale Bearbeiten

Beispiel verbundene Merkmale Bearbeiten

Urliste Bearbeiten

Beispiel Urliste bei verbundenem Merkmal Bearbeiten

Kontingenztabellen Bearbeiten

Gemeinsame absolute und relative Häufigkeit Bearbeiten

Kontingenztabelle Bearbeiten

Beispiel Kontingenztabelle Bearbeiten

Anmerkungen Kontingenztabelle I Bearbeiten

Anmerkungen Kontingenztabelle II Bearbeiten

Bedingte relative Häufigkeiten und Unabhängigkeit Bearbeiten

Bedingte relative Häufigkeiten Bearbeiten

Beispiel bedingte relative Häufigkeiten Bearbeiten

Unabhängigkeit Bearbeiten

Anmerkung Unabhängigkeit Bearbeiten

Beispiel Unabhängigkeit Bearbeiten

Beispiel Unabhängigkeit II Bearbeiten

Beispiel Unabhängigkeit III Bearbeiten

Beispiel Unabhängigkeit III Bearbeiten

Punktwolke Bearbeiten

Beispiel Punktwolke Bearbeiten

Urliste Bearbeiten

Punktwolke Bearbeiten

Urliste für standardisiertes Merkmal Bearbeiten

Standardisierte Punktewolke Bearbeiten

Punktwolke: Anforderung an Skala Bearbeiten

Punktwolke: Erstellung in R Bearbeiten

Pearsonscher Korrelationskoeffizient Bearbeiten

Linearer Zusammenhang zwischen zwei Merkmalen Bearbeiten

Linearer Zusammenhang und Punktwolke Bearbeiten

Produkt der standardisierten Beobachtungswerte Bearbeiten

Bestimmung des Pearsonschen Korrelationskoeffizient Bearbeiten

Zusammenhnag Korrelationskoeffizient und Kovarianz Bearbeiten

Beispiel Pearsonscher Korrelationskoeffizient Bearbeiten

Pearsonscher Korrelationskoeffizient und Art des linearen Zusammenhangs Bearbeiten

Beispiel 1 Bearbeiten

Beispiel 2 Bearbeiten

Beispiel 3 Bearbeiten

Beispiel 4 Bearbeiten

Beispiel 5 Bearbeiten

Beispiel 6 Bearbeiten

Korrelation und Ursache-Wirkungs-Prinzip Bearbeiten

Korrelationskoeffizient nahe 0 Bearbeiten

Berechnung des Korrelationskoeffizienten in R Bearbeiten

Rangkorrelationskoeffizient von Spearman Bearbeiten

Beispiel Bestimmung des Ranges Bearbeiten

Definition Rangkorreltaionskoeffizient Bearbeiten

Rangkorrelationskoeffizient und Art des Zusammenhangs Bearbeiten

Beispiel Bestimmung des Rangkorrelationskoeffizient Bearbeiten

Rangkorrelationskoeffizient und Ursache-Wirkungs-Prinzip Bearbeiten

Berechnung Rangkorrelationskoeffizient in R Bearbeiten

Lineare Regression Bearbeiten

Bestimmung der Regressionsgeraden Bearbeiten

Beispiel Bestimmung der Regressionsgeraden Bearbeiten

Regressionsgerade und Ursache-Wirkungs-Prinzip Bearbeiten

Trendgröße und Realgröße Bearbeiten

Beispiel Trendgröße und Realgröße Bearbeiten

Vergleich Regression X auf Y und Y auf X Bearbeiten

X ist Prädiktor Bearbeiten

Y ist Prädiktor Bearbeiten

Auswahl des Prädiktor Bearbeiten

Beispiel Vergleich Regression X auf Y und Y auf X Bearbeiten

Aufgabe I Bearbeiten

Aufgabe I Fortsetzung Bearbeiten

Aufgabe II Bearbeiten

Seiteninformation Bearbeiten

Wiki2Reveal Bearbeiten