Kurs:Mathematik (Osnabrück 2009-2011)/Teil II/Vorlesung 46

Der Gradient

Lemma

Es sei ${}K$ ein Körper und ${}V$ ein ${}K$ - Vektorraum, der mit einer Bilinearform ${}\left\langle -,-\right\rangle$ versehen sei. Dann gelten folgende Aussagen

Für jeden Vektor ${}u\in V$ sind die Zuordnungen
$V\longrightarrow K,\,v\longmapsto \left\langle u,v\right\rangle ,$

und

$V\longrightarrow K,\,v\longmapsto \left\langle v,u\right\rangle ,$

${}K$ - linear.

Die Zuordnung
$V\longrightarrow {V}^{*},\,u\longmapsto \left\langle u,-\right\rangle ,$

ist ${}K$ -linear.

Wenn ${}\left\langle -,-\right\rangle$ nicht ausgeartet ist, so ist die Zuordnung in (2) injektiv. Ist ${}V$ zusätzlich endlichdimensional, so ist diese Zuordnung bijektiv.

Beweis

(1) folgt unmittelbar aus der Bilinearität.
(2). Es seien ${}u_{1},u_{2}\in V$ und ${}a_{1},a_{2}\in K$ . Dann ist für jeden Vektor ${}v\in V$

{}\left\langle a_{1}u_{1}+a_{2}u_{2},v\right\rangle =a_{1}\left\langle u_{1},v\right\rangle +a_{2}\left\langle u_{2},v\right\rangle \,,

und dies bedeutet gerade die Linearität der Zuordnung.
(3). Da die Zuordnung nach (2) linear ist, müssen wir zeigen, dass der Kern davon trivial ist. Es sei also ${}u\in V$ so, dass ${}\left\langle u,-\right\rangle$ die Nullabbildung ist. D.h. ${}\left\langle u,v\right\rangle =0$ für alle ${}v\in V$ . Dann muss aber nach der Definition von nicht ausgeartet ${}u=0$ sein.
Wenn ${}V$ endliche Dimension hat, so liegt eine injektive lineare Abbildung zwischen Vektorräumen der gleichen Dimension vor, und eine solche ist nach Korollar 12.10 bijektiv.

\Box

Wenn es also in einem endlichdimensionalen Vektorraum eine nicht ausgeartete Bilinearform gibt, bspw. ein Skalarprodukt, so gibt es zu jeder Linearform einen eindeutig bestimmten Vektor, mit dem diese Linearform beschrieben wird. Wendet man dies auf die Linearform an, die durch das totale Differential zu einer differenzierbaren Funktion ${}f\colon V\rightarrow \mathbb {R}$ gegeben ist, so gelangt man zum Begriff des Gradienten.

Definition

Es sei ${}(V,\left\langle -,-\right\rangle )$ ein euklidischer Vektorraum, ${}G\subseteq V$ offen und

f\colon G\longrightarrow \mathbb {R}

eine in ${}P\in G$ differenzierbare Funktion. Dann nennt man den eindeutig bestimmten Vektor ${}w\in V$ mit

{}{\left(Df\right)}_{P}{\left(v\right)}=\left\langle w,v\right\rangle \,

für alle ${}v\in V$ den Gradienten von ${}f$ in ${}P$ . Er wird mit

\operatorname {Grad} \,f(P)

bezeichnet.

Man beachte, dass wir durchgehend die endlichdimensionalen Vektorräume mit einem Skalarprodukt versehen, um topologische Grundbegriffe wie Konvergenz und Stetigkeit zur Verfügung zu haben, dass diese Begriffe aber nicht von dem gewählten Skalarprodukt abhängen. Dem entgegen hängt aber der Gradient von dem gewählten Skalarprodukt ab.

Bei ${}V=\mathbb {R} ^{n}$ , versehen mit dem Standardskalarprodukt, ist der Gradient einfach gleich

{}\operatorname {Grad} \,f(P)={\begin{pmatrix}{\frac {\partial f}{\partial x_{1}}}\\\vdots \\{\frac {\partial f}{\partial x_{n}}}\end{pmatrix}}\,.

Satz

Es sei ${}(V,\left\langle -,-\right\rangle )$ ein euklidischer Vektorraum, sei ${}G\subseteq V$ offen und sei

f\colon G\longrightarrow \mathbb {R}

eine in ${}P\in G$ differenzierbare Funktion. Dann gelten folgende Aussagen.

Für jeden Vektor ${}v\in V$ ist
${}\vert {{\left(Df\right)}_{P}{\left(v\right)}}\vert \leq \Vert {v}\Vert \cdot \Vert {\operatorname {Grad} \,f(P)}\Vert \,.$

Dabei gilt Gleichheit genau dann, wenn ${}v$ linear abhängig zum Gradienten ist.

Sei ${}\operatorname {Grad} \,f(P)\neq 0$ . Unter allen Vektoren ${}v\in V$ mit ${}\Vert {v}\Vert =1$ ist die Richtungsableitung in Richtung des normierten Gradienten maximal, und zwar gleich der Norm des Gradienten.

Beweis

(1) folgt wegen

{}{\left(Df\right)}_{P}{\left(v\right)}=\left\langle v,\operatorname {Grad} \,f(P)\right\rangle \,

direkt aus der Abschätzung von Cauchy-Schwarz. (2) ergibt sich aus den Zusätzen zur Cauchy Schwarz, siehe Aufgabe 46.14. (3). Aus (1) und (2) folgt, dass

{}{\begin{aligned}\vert {\left\langle \operatorname {Grad} \,f(P),\pm {\frac {\operatorname {Grad} \,f(P)}{\Vert {\operatorname {Grad} \,f(P)}\Vert }}\right\rangle }\vert &=\vert {{\left(Df\right)}_{P}{\left(\pm {\frac {\operatorname {Grad} \,f(P)}{\Vert {\operatorname {Grad} \,f(P)}\Vert }}\right)}}\vert \\&=\Vert {\operatorname {Grad} \,f(P)}\Vert \end{aligned}}

gilt, und dass diese beiden Vektoren die einzigen Vektoren der Norm

{}1

sind, für die diese Gleichung gilt. Wenn man links die Betragstriche weglässt, so gilt die Gleichheit für

{}{\frac {\operatorname {Grad} \,f(P)}{\Vert {\operatorname {Grad} \,f(P)}\Vert }}

nach wie vor, da das Skalarprodukt positiv definit ist.

\Box

Der Gradient gibt demnach die Richtung an, in die die Funktion den stärksten Anstieg hat. In die entgegengesetze Richtung liegt entsprechend der steilste Abstieg vor.

Lokale Extrema von Funktionen in mehreren Variablen

Wir wollen mit den Mitteln der Differentialrechnung Kriterien erarbeiten, in welchen Punkten eine Funktion

f\colon G\longrightarrow \mathbb {R}

ein lokales Minimum oder ein lokales Maximum annimmt. Wenn man sich den Graph einer solchen Funktion als ein Gebirge über der Grundmenge ${}G$ vorstellt, so geht es also um die Gipfel und die Senken des Gebirges. Der folgende Satz liefert ein notwendiges Kriterium für die Existenz eines lokalen Extremums, das das entsprechende Kriterium in einer Variablen verallgemeinert.

Satz

Es sei ${}V$ ein endlichdimensionaler reeller Vektorraum und ${}G\subseteq V$ eine offene Teilmenge. Es sei

f\colon G\longrightarrow \mathbb {R}

eine Funktion, die im Punkt ${}P\in G$ ein lokales Extremum besitzt. Dann gelten folgende Aussagen.

Wenn ${}f$ in ${}P$ in Richtung ${}v\in V$ differenzierbar ist, so ist
${}{\left(D_{v}f\right)}{\left(P\right)}=0\,.$

Wenn ${}f$ in ${}P$ total differenzierbar ist, so verschwindet das totale Differential, also
${}\left(Df\right)_{P}=0\,.$

Beweis

(1) Zu ${}v\in V$ betrachten wir die Funktion

h\colon I\longrightarrow \mathbb {R} ,\,t\longmapsto h(t)=f(P+tv),

wobei ${}I$ ein geeignetes reelles Intervall ist. Da die Funktion ${}f$ in ${}P$ ein lokales Extremum besitzt, besitzt die Funktion ${}h$ in ${}t=0$ ebenfalls ein lokales Extremum. Nach Voraussetzung ist ${}h$ differenzierbar und nach Satz 28.1 ist ${}h'(0)=0$ . Diese Ableitung stimmt aber mit der Richtungsableitung überein, also ist

{}{\left(D_{v}f\right)}{\left(P\right)}=h'(0)=0\,.

(2) folgt aus (1) aufgrund von Proposition 45.1.

\Box

Ein lokales Extremum kann also nur in einem sogenannten kritischen Punkt einer Funktion auftreten.

Definition

Es sei ${}V$ ein endlichdimensionaler reeller Vektorraum, ${}G\subseteq V$ offen und

f\colon G\longrightarrow \mathbb {R}

eine differenzierbare Funktion. Dann heißt ${}P\in G$ ein kritischer Punkt von ${}f$ (oder ein stationärer Punkt), wenn

{}\left(Df\right)_{P}=0\,

ist. Andernfalls spricht man von einem regulären Punkt.

Wir sind natürlich auch an hinreichenden Kriterien für das Vorliegen von lokalen Extrema interessiert. Wie schon im eindimensionalen Fall muss man sich die zweiten Ableitungen anschauen, wobei die Situation natürlich dadurch wesentlich verkompliziert wird, dass es zu je zwei Richtungsvektoren ${}v$ und ${}w$ eine zweite Richtungsableitung ${}D_{vw}=D_{v}D_{w}$ gibt. Die zweite Richtungsableitung wird dadurch handhabbar, dass man sie in die sogenannte Hesse-Form bzw. Hesse-Matrix zusammenfasst. Als solche ist sie eine symmetrische Bilinearform, die mit Methoden der linearen Algebra analysiert werden kann. Diese Methoden werden wir im Folgenden entwickeln und insbesondere auf die Hesse-Form anwenden, um schließlich hinreichende Kriterien für die Existenz von lokalen Extrema zu erhalten.

Definition

Es sei ${}V$ ein endlichdimensionaler reeller Vektorraum, ${}G\subseteq V$ eine offene Menge und

f\colon G\longrightarrow \mathbb {R}

eine zweimal stetig differenzierbare Funktion. Zu ${}P\in G$ heißt die Abbildung

\operatorname {Hess} _{P}\,f\colon V\times V\longrightarrow \mathbb {R} ,\,(u,v)\longmapsto D_{u}D_{v}f(P),

die Hesse-Form im Punkt ${}P\in G$ .

Definition

Es sei ${}V$ ein endlichdimensionaler reeller Vektorraum, ${}G\subseteq V$ eine offene Menge und

f\colon G\longrightarrow \mathbb {R}

eine zweimal stetig differenzierbare Funktion. Es sei eine Basis ${}v_{i}$ , ${}i=1,\ldots ,n$ , von ${}V$ gegeben mit den zugehörigen Richtungsableitungen ${}D_{i}:=D_{v_{i}}$ , ${}i=1,\ldots ,n$ . Zu ${}P\in G$ heißt dann die Matrix

{\begin{pmatrix}D_{1}D_{1}f(P)&\cdots &D_{1}D_{n}f(P)\\\vdots &\ddots &\vdots \\D_{n}D_{1}f(P)&\cdots &D_{n}D_{n}f(P)\end{pmatrix}}

die Hesse-Matrix zu ${}f$ im Punkt ${}P$ bezüglich der gegebenen Basis.

Die Hesse-Matrix ist beispielsweise die Gramsche Matrix der Hesse-Form bezüglich der Standardbasis im ${}\mathbb {R} ^{n}$ .

Eigenschaften von Bilinearformen

Definition

Es sei ${}K$ ein Körper, ${}V$ ein endlichdimensionaler ${}K$ - Vektorraum und ${}\left\langle -,-\right\rangle$ eine Bilinearform auf ${}V$ . Es sei ${}v_{1},\ldots ,v_{n}$ eine Basis von ${}V$ . Dann heißt die ${}n\times n$ - Matrix

\left\langle v_{i},v_{j}\right\rangle _{1\leq i,j\leq n}

die Gramsche Matrix von ${}\left\langle -,-\right\rangle$ bezüglich dieser Basis.

Lemma

Es sei ${}K$ ein Körper, ${}V$ ein endlichdimensionaler ${}K$ - Vektorraum und ${}\left\langle -,-\right\rangle$ eine Bilinearform auf ${}V$ . Es seien ${}{\mathfrak {v}}=v_{1},\ldots ,v_{n}$ und ${}{\mathfrak {w}}=w_{1},\ldots ,w_{n}$ zwei Basen von ${}V$ und es seien ${}G$ bzw. ${}H$ die Gramschen Matrizen von ${}\left\langle -,-\right\rangle$ bezüglich dieser Basen. Zwischen den Basiselementen gelte die Beziehungen

{}w_{j}=\sum _{i=1}^{n}a_{ij}v_{i}\,,

die wir durch die Übergangsmatrix ${}A={\left(a_{ij}\right)}_{i,j}$ ausdrücken.

Dann besteht zwischen den Gramschen Matrizen die Beziehung

${}H={A^{\text{tr}}}GA\,.$

Beweis

Es ist

{}{\begin{aligned}\left\langle w_{r},w_{s}\right\rangle &=\left\langle \sum _{i=1}^{n}a_{ir}v_{i},\sum _{k=1}^{n}a_{ks}v_{k}\right\rangle \\&=\sum _{1\leq i,k\leq n}a_{ir}a_{ks}\left\langle v_{i},v_{k}\right\rangle \\&=\sum _{1\leq i\leq n}a_{ir}{\left(\sum _{1\leq k\leq n}a_{ks}\left\langle v_{i},v_{k}\right\rangle \right)}\\&=\sum _{1\leq i\leq n}a_{ir}{\left(G\circ A\right)}_{is}\\&={\left({A^{\text{tr}}}\circ {\left(G\circ A\right)}\right)}_{rs}.\end{aligned}}

\Box

Definition

Es sei ${}K$ ein Körper, ${}V$ ein ${}K$ - Vektorraum und ${}\left\langle -,-\right\rangle$ eine Bilinearform auf ${}V$ . Die Bilinearform heißt symmetrisch, wenn

{}\left\langle v,w\right\rangle =\left\langle w,v\right\rangle \,

für alle ${}v,w\in V$ gilt.

Definition

Es sei ${}V$ ein reeller Vektorraum mit einer symmetrischen Bilinearform ${}\left\langle -,-\right\rangle$ . Diese Bilinearform heißt

positiv definit, wenn ${}\left\langle v,v\right\rangle >0$ für alle ${}v\in V$ , ${}v\neq 0$ ist.
negativ definit, wenn ${}\left\langle v,v\right\rangle <0$ für alle ${}v\in V$ , ${}v\neq 0$ ist.
positiv semidefinit, wenn ${}\left\langle v,v\right\rangle \geq 0$ für alle ${}v\in V$ ist.
negativ semidefinit, wenn ${}\left\langle v,v\right\rangle \leq 0$ für alle ${}v\in V$ ist.
indefinit, wenn ${}\left\langle -,-\right\rangle$ weder positiv semidefinit noch negativ semidefinit ist.

Positiv definite symmetrische Bilinearformen nennt man auch Skalarprodukte. Eine Bilinearform auf ${}V$ kann man auf einen Untervektorraum ${}U\subseteq V$ einschränken, wodurch sich eine Bilinearform auf ${}U$ ergibt. Wenn die ursprüngliche Form positiv definit ist, so überträgt sich dies auf die Einschränkung. Allerdings kann eine indefinite Form eingeschränkt auf gewisse Unterräume positiv definit werden und auf andere negativ definit. Dies führt zu folgender Definition.

Definition

Es sei ${}V$ ein endlichdimensionaler reeller Vektorraum mit einer symmetrischen Bilinearform ${}\left\langle -,-\right\rangle$ . Man sagt, dass eine solche Bilinearform den Typ

(p,q)

besitzt, wobei

{}p:={\max {\left(\dim _{\mathbb {R} }{\left(U\right)},U\subseteq V,\,\left\langle -,-\right\rangle {|}_{U}{\text{ positiv definit}}\right)}}\,

und

{}q:={\max {\left(\dim _{\mathbb {R} }{\left(U\right)},U\subseteq V,\,\left\langle -,-\right\rangle {|}_{U}{\text{ negativ definit}}\right)}}\,

ist.

Bei einem Skalarprodukt auf einem ${}n$ -dimensionalen reellen Vektorraum ist der Typ ${}(n,0)$ . Wie für Skalarprodukte nennt man zwei Vektoren ${}v,w\in V$ orthogonal bezüglich einer Bilinearform, wenn ${}\left\langle v,w\right\rangle =0$ ist, und ähnlich wie im Fall eines Skalarproduktes kann man zeigen, dass es Orthogonalbasen gibt. Die folgende Aussage nennt man den Trägheitssatz von Sylvester.

Satz

Es sei ${}V$ ein endlichdimensionaler reeller Vektorraum mit einer symmetrischen Bilinearform ${}\left\langle -,-\right\rangle$ vom Typ ${}(p,q)$ .

Dann ist die Gramsche Matrix von ${}\left\langle -,-\right\rangle$ bezüglich einer jeden Orthogonalbasis eine Diagonalmatrix mit ${}p$ positiven und ${}q$ negativen Einträgen.

Beweis

Bezüglich einer Orthogonalbasis ${}u_{1},\ldots ,u_{n}$ von ${}V$ (die es nach Fakt ***** gibt) hat die Gramsche Matrix natürlich Diagonalgestalt. Es sei ${}p'$ die Anzahl der positiven Diagonaleinträge und ${}q'$ die Anzahl der negativen Diagonaleinträge. Die Basis sei so geordnet, dass die ersten ${}p'$ Diagonaleinträge positiv, die folgenden ${}q'$ Diagonaleinträge negativ und die übrigen ${}0$ seien. Auf dem ${}p'$ -dimensionalen Unterraum ${}U=\langle u_{1},\ldots ,u_{p'}\rangle$ ist die eingeschränkte Bilinearform positiv definit, sodass ${}p'\leq p$ gilt. Sei ${}W=\langle u_{p'+1},\ldots ,u_{n}\rangle$ , auf diesem Unterraum ist die Bilinearform negativ semidefinit. Dabei ist ${}V=U\oplus W$ , und diese beiden Räume sind orthogonal zueinander.

Angenommen, es gebe einen Unterraum ${}U'$ , auf dem die Bilinearform positiv definit ist, und dessen Dimension ${}p$ größer als ${}p'$ ist. Die Dimension von ${}W$ ist ${}n-p'$ und daher ist ${}W\cap U'\neq 0$ nach Fakt *****.

Für einen Vektor ${}w\in W\cap U'$ , ${}w\neq 0$ , ergibt sich aber direkt der Widerspruch ${}\left\langle w,w\right\rangle >0$ und ${}\left\langle w,w\right\rangle \leq 0$ .

\Box

<< | Kurs:Mathematik (Osnabrück 2009-2011)/Teil II | >>

PDF-Version dieser Vorlesung

Arbeitsblatt zur Vorlesung (PDF)