Für die Regression in einer Dimension ist gültig, Es wird zunächst davon ausgegangen, dass ein linearer Zusammenhang vorliegt, der das Aufstellen der Hypothese
erlaubt. Damit wird als Hypothesenraum der Raum der linearen Funktionen betrachtet, der isomorph zu ist. Das empirische Risiko wird bei Regressionen durch
bestimmt und soll minimiert werden. Dies bedeutet, dass die Ableitungen von nach bzw. verschwinden müssen. Durch das Lösen der Gleichungen können die idealen Parameter und bestimmt werden. Zu diesem Zweck bietet es sich an, einige statistische Größen zu definieren:
Der Mittelwert eines Satzes von Werten einer Größe ist durch definiert.
Die Varianz gibt die Streuung um den Mittelwert an und kann durch gefunden werden.
Liegen Werte zweier Größen und vor, so kann die Kovarianz definiert werden. Aus ihr wird häufig auch die Korrelation definiert. Im Fall wird von (linear) unkorrellierten Daten gesprochen, d.h. es besteht kein linearer Zusammenhang zwischen den Größen und . Nimmt positive bzw. negative Werte an, so wird von positiver bzw. negativer Korellation gesprochen. Das bedeutet, dass eine Größe steigt, während die andere steigt bzw. fällt.
Mit diesen Begriffen, lassen sich die idealen Gewichte
Betrachte den Datensatz der folgenden Tabelle, der aus einer linearen Funktion mit Steigung und -Achsenabschnitt mit einem gleichverteilten Rauschen der Amplitude
Daten
Bestimme die Größen , , , , , , und bis auf zwei Nachkommastellen genau.