Vorherige Seite: K1 - Hypothesen aus Daten Ableiten
Nächste Seite : K2 - Lineare Regression in d Dimension

Für die Regression in einer Dimension ist gültig, Es wird zunächst davon ausgegangen, dass ein linearer Zusammenhang vorliegt, der das Aufstellen der Hypothese


erlaubt. Damit wird als Hypothesenraum der Raum der linearen Funktionen betrachtet, der isomorph zu ist. Das empirische Risiko wird bei Regressionen durch


bestimmt und soll minimiert werden. Dies bedeutet, dass die Ableitungen von nach bzw. verschwinden müssen. Durch das Lösen der Gleichungen können die idealen Parameter und bestimmt werden. Zu diesem Zweck bietet es sich an, einige statistische Größen zu definieren:

  • Der Mittelwert eines Satzes von Werten einer Größe ist durch definiert.
  • Die Varianz gibt die Streuung um den Mittelwert an und kann durch gefunden werden.
  • Liegen Werte zweier Größen und vor, so kann die Kovarianz definiert werden. Aus ihr wird häufig auch die Korrelation definiert. Im Fall wird von (linear) unkorrellierten Daten gesprochen, d.h. es besteht kein linearer Zusammenhang zwischen den Größen und . Nimmt positive bzw. negative Werte an, so wird von positiver bzw. negativer Korellation gesprochen. Das bedeutet, dass eine Größe steigt, während die andere steigt bzw. fällt.

Mit diesen Begriffen, lassen sich die idealen Gewichte


bestimmen.

Betrachte den Datensatz der folgenden Tabelle, der aus einer linearen Funktion mit Steigung   und  -Achsenabschnitt   mit einem gleichverteilten Rauschen der Amplitude  

Daten
   
   
   
   
   
   

Bestimme die Größen  ,  ,  ,  ,  ,  ,   und   bis auf zwei Nachkommastellen genau.

Lösungen