Mehrdimensionale lineare Regression/Schätzfunktion - eindimensional

Einleitung

Bearbeiten

Diese Lerneinheit behandelt mit dem Thema zur eindimensionalen Schätzfunktion die Parameterschätzung für die Steigung und das y-Achsenabschnitt der Regressionsgerade im   im Kontext der linearen Regression[1]. Die Lernresource kann als Wiki2Reveal Folien angezeigt werden. Einzelne Abschnitte werden als Folien betrachtet und Änderungen an den Folien wirken sich sofort auf den Inhalt der Folien aus. Dabei werden die folgenden Teilaspekte im Detail behandelt:

  • (1) Wie kann man die Steigung aus den Datenpunkten   schätzen?
  • (2) Wie kann man mit berechneter Steigung den y-Achsenabschnitt der Regressiongerade bestimmen?

Zielsetzung

Bearbeiten

Diese Lernressource zu eindimensionalen Schätzfunktion für Steigung und y-Achsenabschniit für   hat das Ziel, den mehrdimensionale Fall einer affinen Abbildung   mit  ,   und   vorzubereiten.

Lernvoraussetzungen

Bearbeiten

Die Lernressource zum Thema eindimensionalen Schätzfunktion bei der linearen Regression hat die folgenden Lernvoraussetzungen, die zum Verständnis der nachfolgenden Ausführungen hilfreich bzw. notwendig sind.

Daten der linearen Regression

Bearbeiten

Gegeben Sie   Datenpaare der Form   mit:

 

Funktionsparameter - Steigung und y-Achsenabschnitt

Bearbeiten

Gesucht sind bei einer linearen Regression die Steigung   und der y-Achsenabschnitt   für eine Funktion   mit  .

Ideale Fall der Regression - Interpolation

Bearbeiten

Betrachtet man eine ideale Approximation der Daten  , dann interpoliert die Funktion   alle Daten aus   und es gilt   für alle  .

Fehler in der Approximation der Daten

Bearbeiten

Die folgenden Abbildung zeigt Datenpunkte in rot und eine blaue Regressionsgerade, die die Datenpunkte nicht interpoliert. Die Approximation der Daten mit einer Funktion   zeigt für die einzelnen Datenpunkte Fehler.

 

Residuum als Abweichung von einem Sollwert

Bearbeiten

Ein Residuum bezeichnet dabei die Differenz   zwischen der empirischen Beobachtung   an der Stelle   und der geschätzten Funktionswert der Regressionsfunktion   an der Stelle  .

Beispiel - Abweichung von einem Sollwert

Bearbeiten

Ist   und der Datenpunkt   gegeben, dann wird das Residuum   für   wie folgt berechnet:

 

Das Residuum   besagt nun, dass der beobachtet Wert   um 2 Einheiten über dem geschätzte Funktionswert   liegt.

Fehlerminimierung für die Methode der Kleinsten-Quadrate

Bearbeiten

Für die gegeben   Datenpaare der Form   betrachtet man die quadratischen Einzelfehler der Form

 

Diese Einfehler aggregiert man nun über alles Datenpaare aus   und erhält als quadratischen Gesamtfehler:

 .

Dieser quadratische Fehler der lineare Regression soll nun minimiert werden.

Schätzfunktionen der Kleinste-Quadrate-Schätzer

Bearbeiten

Aus der Regressionsgleichung   lassen sich die Schätzfunktionen   für   und   für   ableiten.

Arithmetisches Mittel der Rohdaten

Bearbeiten

Mit den Rohdaten   kann man das arithmetische Mittel der  -Werte und  -Werte bilden:

 

Schätzer für die Steigung der Regressiongerade

Bearbeiten

Betrachtet man die Vektoren   und   aus den Rohdaten  , so wird die Schätzfunktion für die Steigung   von   wie folgt definiert:

 

Schätzer für y-Achsenabschnitt der Regressiongerade

Bearbeiten

Die Regressionsgerade läuft durch den  , dessen Komponenten über das arithmetische Mittel der  -Werte   arithmetische Mittel der  -Werte   gebildet wird. Die Funktionsgleichung   liefert dann   über

 

Linearität

Bearbeiten

Die Formeln zeigen auch, dass die Schätzfunktionen   und   der Regressionsparameter   und   linear von   abhängen.

Normalverteilung der Residuuen

Bearbeiten

Unter der Annahme der Normalverteilung der Residuen   oder wenn die Beobachtungsdaten   den zentralen Grenzwertsatz erfüllen, folgt, dass auch die Schätzfunktionen der Regressionsparameter   und   für die Daten   zumindest approximativ normalverteilt sind:

  und  .

Aufgaben für Lernende / Studierende

Bearbeiten
  • Berechnen Sie für die obigen 4 Datenpunkte in der Abbildung die Steigung und den y-Achsenabschnitt der Regressionsgerade!
  • Berechnen Sie die Regressionsgerade mit Datenpunkten Ihrer Wahl mit GNU R!
  • Zeigen Sie die Linearität der Schätzfunktionen   und   in der zweiten Komponenten  !

Literatur/Quellennachweise

Bearbeiten
  1. Groß, J. (2012). Linear regression (Vol. 175). Springer Science & Business Media.


Siehe auch

Bearbeiten

Seiteninformation

Bearbeiten

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Bearbeiten

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Mehrdimensionale lineare Regression' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.