Mehrdimensionale lineare Regression/Komponentenfunktionen

Einleitung

Bearbeiten

Diese Seite zum Thema Mehrdimensionale lineare Regression/Komponentenfunktionen kann als Wiki2Reveal Folien angezeigt werden. Einzelne Abschnitte werden als Folien betrachtet und Änderungen an den Folien wirken sich sofort auf den Inhalt der Folien aus. Dabei werden die folgenden Teilaspekte im Detail behandelt:

  • (1 Zerlegung einer linearen Funktion   in lineare Komponentenfunktionen  
  • (2) Durchführung der linearen Regression für die Komponentenfunktion.
  • (3) Nutzung der Regression bzgl. der Komponentenfunktion   für die Funktion   mit darstellender  -Matrix  .

Zielsetzung

Bearbeiten

Diese Lernressource zu den Komponentenfunktionen eine mehrdimensionalen lineare Abbildung hat das Ziel, die lineare Regression einer mehrdimensionalen Funktion   auf eine einfachere lineare Regression der Komponentenfunktionen   als Skalarprodukt zu vereinfachen und dann diese lineare Regression mit einem eindimensionalen Wertebereich durchzuführen.

Lernvoraussetzungen

Bearbeiten

Die Lernressource zum Thema Mehrdimensionale lineare Regression/Komponentenfunktionen hat die folgenden Lernvoraussetzungen, die zum Verständnis der nachfolgenden Ausführungen hilfreich bzw. notwendig sind.

Ziel der linearen Regression - Dimension 1

Bearbeiten

Ist der Wertebereich der linearen Abbildung eindimensional ist   und Daten   sucht man einen geeigneten Vektor  , sodass der absolute aggregierte quadratische Fehler   über alle Daten aus   möglichst klein wird.

 


Fehler für Datenpunkte

Bearbeiten

Für einen einzelnen Datenpunkt   kann man mit   jeweils den Fehler wie folgt angeben:

 

Definition der Fehlerfunktion

Bearbeiten

Nun kann man die Fehlerfunktion   der linearen Regression mit eindimensionalen Wertebereich definieren:

 

Implemenation der Fehlerfunktion in R

Bearbeiten

In der folgenden Implementation bezeichnet p immer Variablen, die als Parameter der Funktion übergeben.

   e_LR <- function (px,pa,py) {
    ## pa : Vektor - n-dimensional a
    ## px : Vektor - n-dimensional x
    ## py : Zahl - Messwert y
    return <-  sum(pa * px) - py 
    ## Rückgabewert: Fehler für (pa,px,py) 
    return
  }

Aufruf der Fehlerfunktion in R

Bearbeiten

Mit der obigen Definition steht nun die Funktion zur Verfügung und man kann den Fehler für gegebene Vektoren   und dem Messwert   berechnen.

  ## Aufruf der Funktion für den Vektor x
  a <- c(1,3,4)
  x <- c(4,2,1)
  sum(a*x) ## Ergebnis <a,x> = 14
  y <- 14.4
  e_LR(a,x,y) ## Ergebnis -0,4

Quadratische Fehler für Datenpunkte

Bearbeiten

Der quadratische Fehler ergibt aus dem Quadrat der euklidischen Länge (Norm) des Fehlervektors   mit

 

Dabei ist die euklidische Norm wie folgt definiert:

 

Implementation - Quadratischer Fehler in R

Bearbeiten

Die Norm ist in R bereits definiert und kann wie folgt berechnet werden.

e <- c(3, 4) ## Fehlervektor mit zwei Komponenten
norm(e,"2")  ## liefert als Länge von e den Wert 5=sqrt(3^2+4^4)=sqrt(25)

Normquadrat - Summe der Komponentenquadrate

Bearbeiten

Da die Norm im obigen Beispiel quadriert wird, ist der absolute (quadratische) Fehler allgemein die Summe der Quadrate, d.h

 

Implementation des quadratischen Fehlers in R

Bearbeiten

Damit lässt der quadratische Fehler wie folgt berechnen:

error2 <- function (px) {
   return <- sum(px^2)
   ## Rückgabewert: quaderror - quadratischer Fehler
   return
}

## quadratischen Fehler berechnen von v 
v <- c(3,4)
error2(v)   ## liefert den Wert 25 als quadratischen Fehler

## quadratischen Fehler der affinen Abbildung f
e <- f(x) - y
error2(e)

Bemerkung - Dimension des Vektors als Parameter px

Bearbeiten

Die Funktion error2(px) erlaubt das einsetzen von Spaltenvektoren error2(v) mit beliebiger Anzahl von numerischen Komponenten.

Fehlerfunktion der Linearen Regression in R

Bearbeiten
 E_LR <- function (pa,px_D,py_D) {
    ## pa : darstellender Vektor von f_a
    ## px_D : Dataframe - Liste von x-Vektoren   
    ## py_D : Dataframe - Liste von y-Werten
    
    ## Fehler pro Datenpunkt berechnen
    datenanzahl <- nrow(px_D) ## Anzahl Reihen px_D
    e_D <- rep(0,datenanzahl)
    ## Fehler für alle Datenpunkte berechnen 
    for (i in 1:datenanzahl) {
      ## quadratische Einfehler mit Funktion e 
      e_D[i] <- (sum(pa*px_D[i, ]) - py_D[i, ])^2
    } 
    ## Rückgabewert: aufsummierte Einzelfehler aus e_D
    return <-  sum(e_D) 
    ## Rückgabewert: return  Gesamtfehler quadratisch
    return
 }

Daten für Fehlerfunktion in R definieren

Bearbeiten
## Datenspalten festlegen
x1 <- c(1,2,7,7) # Datenspalte für x1
x2 <- c(2,3,0,6) # Datenspalte für x2
x3 <- c(3,1,4,5) # Datenspalte für x3
y1 <- c(16.1,22.1,25.9,56.6) # Datenspalte für y1
## Daten für x aus IR^3
x_D <- data.frame(x1,x2,x3)
## Daten für y aus IR^3
y_D <- data.frame(y1)

Fehlerfunktion in R aufrufen

Bearbeiten
## a für f_a(x)=<a,x> definieren
a <- c(2,3,2)
## Fehler für a berechnen
E_LR(a,x_D,y_D) 
 
## a verändern für f_a(x)=<a,x> 
a <- c(3,5,2)
## Fehler für a erneut berechnen
E_LR(a,x_D,y_D)

Gradient der Fehlerfunktion in R

Bearbeiten
 GradE_LR <- function (pa,px_D,py_D) {
    ## px_D : Dataframe - Liste von x-Vektoren   
    ## py_D : Dataframe - Liste von y-Werten
    ## pa : darstellender Vektor von f_a
    
    ## Fehler pro Datenpunkt 
    datenanzahl <- nrow(px_D)
    grad <- rep(0,length(pa)) 
    e_D <- rep(0,datenanzahl)
    ## Fehler für alle Datenpunkte berechnen 
    for (i in 1:datenanzahl) {
      ## quadratische Einfehler mit Funktion e 
      grad <- grad + (sum(pa*px_D[i, ]) - py_D[i, ]) * px_D[i, ]
    } 
    ## grad (dataframe) als Vektor umwandeln
    return <- as.vector(unlist(grad))
    ## Rückgabewert: Gradient der Fehlerfunktion in pa
    return
  }

Gradient für Vektor berechnen

Bearbeiten

Für die oben angegebenen und in R definierten Daten   und   wird nun der Gradient der Fehlerfunktion

 

für den Vektor   berechnet.

 a <- c(5,2,19)
 g <- GradE_LR(a,x_D,y_D)
 g ## Gradient ausgeben

Siehe auch

Bearbeiten

Seiteninformation

Bearbeiten

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Bearbeiten

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Mehrdimensionale lineare Regression' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.