Totale Differenzierbarkeit und partielle Ableitungen
Im Folgenden wollen wir den Zusammenhang zwischen Richtungsableitungen, partiellen Ableitungen und dem totalen Differential verstehen.
Totale Differenzierbarkeit impliziert richtungsweise Differenzierbarkeit.
Da
(
D
φ
)
P
{\displaystyle {}\left(D\varphi \right)_{P}}
eine
lineare Abbildung
von
V
{\displaystyle {}V}
nach
W
{\displaystyle {}W}
ist, liefert die Anwendung dieser Abbildung auf einen Vektor
v
∈
V
{\displaystyle {}v\in V}
einen Vektor in
(
D
φ
)
P
(
v
)
∈
W
{\displaystyle {}{\left(D\varphi \right)}_{P}{\left(v\right)}\in W}
.
Nach Voraussetzung haben wir
φ
(
P
+
v
)
=
φ
(
P
)
+
(
D
φ
)
P
(
v
)
+
‖
v
‖
⋅
r
(
v
)
{\displaystyle {}\varphi (P+v)=\varphi (P)+{\left(D\varphi \right)}_{P}{\left(v\right)}+\Vert {v}\Vert \cdot r(v)\,}
(mit den
üblichen Bedingungen
an
r
{\displaystyle {}r}
).
Insbesondere gilt für
(hinreichend kleines)
s
∈
K
{\displaystyle {}s\in {\mathbb {K} }}
φ
(
P
+
s
v
)
=
φ
(
P
)
+
s
(
D
φ
)
P
(
v
)
+
|
s
|
⋅
‖
v
‖
⋅
r
(
s
v
)
.
{\displaystyle {}\varphi (P+sv)=\varphi (P)+s{\left(D\varphi \right)}_{P}{\left(v\right)}+\vert {s}\vert \cdot \Vert {v}\Vert \cdot r(sv)\,.}
Also gilt
lim
s
→
0
,
s
≠
0
φ
(
P
+
s
v
)
−
φ
(
P
)
s
=
lim
s
→
0
,
s
≠
0
s
(
D
φ
)
P
(
v
)
+
|
s
|
⋅
‖
v
‖
⋅
r
(
s
v
)
s
=
lim
s
→
0
,
s
≠
0
(
(
D
φ
)
P
(
v
)
+
|
s
|
s
‖
v
‖
⋅
r
(
s
v
)
)
=
(
D
φ
)
P
(
v
)
,
{\displaystyle {}{\begin{aligned}\operatorname {lim} _{s\rightarrow 0,s\neq 0}\,{\frac {\varphi (P+sv)-\varphi (P)}{s}}&=\operatorname {lim} _{s\rightarrow 0,s\neq 0}\,{\frac {s{\left(D\varphi \right)}_{P}{\left(v\right)}+\vert {s}\vert \cdot \Vert {v}\Vert \cdot r(sv)}{s}}\\&=\operatorname {lim} _{s\rightarrow 0,s\neq 0}\,\left({\left(D\varphi \right)}_{P}{\left(v\right)}+{\frac {\vert {s}\vert }{s}}\Vert {v}\Vert \cdot r(sv)\right)\\&={\left(D\varphi \right)}_{P}{\left(v\right)},\end{aligned}}}
da
lim
s
→
0
r
(
s
v
)
=
0
{\displaystyle {}\operatorname {lim} _{s\rightarrow 0}\,r(sv)=0}
und der Ausdruck
|
s
|
s
‖
v
‖
{\displaystyle {}{\frac {\vert {s}\vert }{s}}\Vert {v}\Vert }
beschränkt ist.
◻
{\displaystyle \Box }
Vor dem Beweis der nächsten Aussage erinnern wir an den Mittelwertsatz für Kurven: Sei
h
:
[
a
,
b
]
→
K
n
{\displaystyle {}h\colon [a,b]\rightarrow {\mathbb {K} }^{n}}
differenzierbar. Dann existiert ein
c
∈
[
a
,
b
]
{\displaystyle {}c\in [a,b]}
mit
‖
h
(
b
)
−
h
(
a
)
‖
≤
(
b
−
a
)
‖
h
′
(
c
)
‖
.
{\displaystyle \Vert {h(b)-h(a)}\Vert \leq (b-a)\Vert {h'(c)}\Vert .}
Es sei
G
⊆
K
n
{\displaystyle {}G\subseteq {\mathbb {K} }^{n}}
offen und
φ
:
G
→
K
m
{\displaystyle {}\varphi \colon G\rightarrow {\mathbb {K} }^{m}}
eine Abbildung. Es seien
x
i
{\displaystyle {}x_{i}}
,
i
=
1
,
…
,
n
{\displaystyle {}i=1,\ldots ,n}
,
die Koordinaten von
K
n
{\displaystyle {}{\mathbb {K} }^{n}}
und
P
∈
G
{\displaystyle {}P\in G}
ein Punkt. Es sei angenommen, dass alle
partiellen Ableitungen
von
φ
{\displaystyle {}\varphi }
in einer
offenen Umgebung
von
P
{\displaystyle {}P}
existieren und in
P
{\displaystyle {}P}
stetig
sind.
Dann ist
φ
{\displaystyle {}\varphi }
in
P
{\displaystyle {}P}
(total) differenzierbar .
Ist die Abbildung
φ
{\displaystyle {}\varphi }
bezüglich der
Standardbasis
des
K
m
{\displaystyle {}{\mathbb {K} }^{m}}
durch die
Koordinatenfunktionen
f
1
,
…
,
f
m
{\displaystyle {}f_{1},\ldots ,f_{m}}
gegeben, so wird unter diesen Bedingungen das totale Differential in
P
{\displaystyle {}P}
durch die
Jacobi-Matrix
(
∂
f
j
∂
x
i
(
P
)
)
1
≤
i
≤
n
,
1
≤
j
≤
m
{\displaystyle {\left({\frac {\partial f_{j}}{\partial x_{i}}}(P)\right)}_{1\leq i\leq n,1\leq j\leq m}}
beschrieben.
Indem wir
G
{\displaystyle {}G}
durch eine eventuell kleinere offene Umgebung von
P
{\displaystyle {}P}
ersetzen, können wir annehmen, dass auf
G
{\displaystyle {}G}
die Richtungsableitungen
Q
⟼
(
D
i
φ
)
(
Q
)
:=
(
D
e
i
φ
)
(
Q
)
=
(
∂
f
1
∂
x
i
(
Q
)
⋮
∂
f
m
∂
x
i
(
Q
)
)
∈
K
m
{\displaystyle Q\longmapsto (D_{i}\varphi )(Q):={\left(D_{e_{i}}\varphi \right)}{\left(Q\right)}={\begin{pmatrix}{\frac {\partial f_{1}}{\partial x_{i}}}(Q)\\\vdots \\{\frac {\partial f_{m}}{\partial x_{i}}}(Q)\end{pmatrix}}\in {\mathbb {K} }^{m}}
existieren und in
P
{\displaystyle {}P}
stetig sind. Daher ist nach
Proposition 45.1
die lineare Abbildung
K
n
⟶
K
m
,
v
=
(
v
1
,
…
,
v
n
)
⟼
∑
i
=
1
n
v
i
(
D
i
φ
)
(
P
)
,
{\displaystyle {\mathbb {K} }^{n}\longrightarrow {\mathbb {K} }^{m},\,v=(v_{1},\ldots ,v_{n})\longmapsto \sum _{i=1}^{n}v_{i}(D_{i}\varphi )(P),}
der einzige Kandidat für das
totale Differential .
Daher müssen wir zeigen, dass diese
lineare Abbildung
die
definierende Eigenschaft
des totalen Differentials besitzt. Setze
P
i
:=
P
+
v
1
e
1
+
⋯
+
v
i
e
i
{\displaystyle {}P_{i}:=P+v_{1}e_{1}+\cdots +v_{i}e_{i}}
(abhängig von
v
{\displaystyle {}v}
).
Dann gelten mit dem Ansatz
r
(
v
)
:=
φ
(
P
+
v
)
−
φ
(
P
)
−
∑
i
=
1
n
v
i
(
D
i
(
φ
)
)
(
P
)
‖
v
‖
{\displaystyle {}r(v):={\frac {\varphi (P+v)-\varphi (P)-\sum _{i=1}^{n}v_{i}(D_{i}(\varphi ))(P)}{\Vert {v}\Vert }}\,}
(für
v
{\displaystyle {}v}
hinreichend klein)
die Abschätzungen
‖
r
(
v
)
‖
=
‖
φ
(
P
+
v
)
−
φ
(
P
)
−
∑
i
=
1
n
v
i
(
D
i
(
φ
)
)
(
P
)
‖
‖
v
‖
=
‖
∑
i
=
1
n
(
φ
(
P
i
)
−
φ
(
P
i
−
1
)
−
v
i
(
D
i
(
φ
)
)
(
P
)
)
‖
‖
v
‖
≤
∑
i
=
1
n
‖
φ
(
P
i
)
−
φ
(
P
i
−
1
)
−
v
i
(
D
i
(
φ
)
)
(
P
)
‖
‖
v
‖
=
∑
i
=
1
n
‖
φ
(
P
i
−
1
+
v
i
e
i
)
−
φ
(
P
i
−
1
)
−
v
i
(
D
i
(
φ
)
)
(
P
)
‖
‖
v
‖
.
{\displaystyle {}{\begin{aligned}\Vert {r(v)}\Vert &={\frac {\Vert {\varphi (P+v)-\varphi (P)-\sum _{i=1}^{n}v_{i}(D_{i}(\varphi ))(P)}\Vert }{\Vert {v}\Vert }}\\&={\frac {\Vert {\sum _{i=1}^{n}(\varphi (P_{i})-\varphi (P_{i-1})-v_{i}(D_{i}(\varphi ))(P))}\Vert }{\Vert {v}\Vert }}\\&\leq \sum _{i=1}^{n}{\frac {\Vert {\varphi (P_{i})-\varphi (P_{i-1})-v_{i}(D_{i}(\varphi ))(P)}\Vert }{\Vert {v}\Vert }}\\&=\sum _{i=1}^{n}{\frac {\Vert {\varphi (P_{i-1}+v_{i}e_{i})-\varphi (P_{i-1})-v_{i}(D_{i}(\varphi ))(P)}\Vert }{\Vert {v}\Vert }}.\end{aligned}}}
Wir betrachten jeden Summanden einzeln. Für fixiertes
i
{\displaystyle {}i}
ist die Abbildung
(die auf dem Einheitsintervall definiert ist)
h
i
:
s
⟼
φ
(
P
i
−
1
+
s
v
i
e
i
)
−
s
v
i
(
D
i
(
φ
)
)
(
P
)
{\displaystyle h_{i}:s\longmapsto \varphi (P_{i-1}+sv_{i}e_{i})-sv_{i}(D_{i}(\varphi ))(P)}
differenzierbar
(aufgrund der Existenz der partiellen Ableitungen auf
G
{\displaystyle {}G}
)
mit der Ableitung
s
⟼
v
i
(
D
i
(
φ
)
)
(
P
i
−
1
+
s
v
i
e
i
)
−
v
i
(
D
i
(
φ
)
)
(
P
)
.
{\displaystyle s\longmapsto v_{i}(D_{i}(\varphi ))(P_{i-1}+sv_{i}e_{i})-v_{i}(D_{i}(\varphi ))(P).}
Nach der
Mittelwertabschätzung
existiert eine reelle Zahl
0
≤
c
i
=
1
,
{\displaystyle {}0\leq c_{i}=1\,,}
sodass
(dies ist die Norm von
h
i
(
1
)
−
h
i
(
0
)
{\displaystyle h_{i}(1)-h_{i}(0)}
)
‖
φ
(
P
i
−
1
+
v
i
e
i
)
−
φ
(
P
i
−
1
)
−
v
i
(
D
i
(
φ
)
)
(
P
)
‖
≤
‖
v
i
(
D
i
(
φ
)
)
(
P
i
−
1
+
c
i
v
i
e
i
)
−
v
i
(
D
i
(
φ
)
)
(
P
)
‖
=
|
v
i
|
⋅
‖
(
D
i
(
φ
)
)
(
P
i
−
1
+
c
i
v
i
e
i
)
−
(
D
i
(
φ
)
)
(
P
)
‖
≤
‖
v
‖
⋅
‖
(
D
i
(
φ
)
)
(
P
i
−
1
+
c
i
v
i
e
i
)
−
(
D
i
(
φ
)
)
(
P
)
‖
{\displaystyle {}{\begin{aligned}\Vert {\varphi (P_{i-1}+v_{i}e_{i})-\varphi (P_{i-1})-v_{i}(D_{i}(\varphi ))(P)}\Vert &\leq \Vert {v_{i}(D_{i}(\varphi ))(P_{i-1}+c_{i}v_{i}e_{i})-v_{i}(D_{i}(\varphi ))(P)}\Vert \\&=\vert {v_{i}}\vert \cdot \Vert {(D_{i}(\varphi ))(P_{i-1}+c_{i}v_{i}e_{i})-(D_{i}(\varphi ))(P)}\Vert \\&\leq \Vert {v}\Vert \cdot \Vert {(D_{i}(\varphi ))(P_{i-1}+c_{i}v_{i}e_{i})-(D_{i}(\varphi ))(P)}\Vert \,\end{aligned}}}
gilt. Aufsummieren liefert also, dass unser Ausdruck
‖
r
(
v
)
‖
{\displaystyle {}\Vert {r(v)}\Vert }
nach oben
beschränkt
ist durch
∑
i
=
1
n
‖
v
‖
⋅
‖
(
D
i
(
φ
)
)
(
P
i
−
1
+
c
i
v
i
e
i
)
−
(
D
i
(
φ
)
)
(
P
)
‖
‖
v
‖
≤
∑
i
=
1
n
‖
(
D
i
(
φ
)
)
(
P
i
−
1
+
c
i
v
i
e
i
)
−
(
D
i
(
φ
)
)
(
P
)
‖
{\displaystyle {}{\begin{aligned}\sum _{i=1}^{n}{\frac {\Vert {v}\Vert \cdot \Vert {(D_{i}(\varphi ))(P_{i-1}+c_{i}v_{i}e_{i})-(D_{i}(\varphi ))(P)}\Vert }{\Vert {v}\Vert }}&\leq \sum _{i=1}^{n}\Vert {(D_{i}(\varphi ))(P_{i-1}+c_{i}v_{i}e_{i})-(D_{i}(\varphi ))(P)}\Vert \\\,\end{aligned}}}
Da die partiellen Ableitungen
D
i
(
φ
)
{\displaystyle {}D_{i}(\varphi )}
stetig in
P
{\displaystyle {}P}
sind, wird die Summe rechts mit
v
{\displaystyle {}v}
beliebig klein, da dann
P
i
−
1
+
c
i
v
i
e
i
{\displaystyle {}P_{i-1}+c_{i}v_{i}e_{i}}
gegen
P
{\displaystyle {}P}
konvergiert. Also ist der Grenzwert für
v
→
0
{\displaystyle {}v\rightarrow 0}
gleich
0
{\displaystyle {}0}
.
◻
{\displaystyle \Box }
Dies folgt aus
Satz 45.2
und daraus, dass die partiellen Ableitungen von Polynomfunktionen wieder Polynomfunktionen und daher nach
Fakt *****
stetig
sind.
◻
{\displaystyle \Box }
Zu einer reellwertigen Funktion
f
:
G
⟶
R
{\displaystyle f\colon G\longrightarrow \mathbb {R} }
interessieren wir uns wie schon bei einem eindimensionalen Definitionsbereich für die Extrema, also Maxima und Minima, der Funktion, und inwiefern man dies anhand der Ableitungen
(falls diese existieren) erkennen kann. Wenn eine solche Funktion total differenzierbar ist, so ist das totale Differential in einem Punkt eine lineare Abbildung von
V
{\displaystyle {}V}
nach
K
{\displaystyle {}{\mathbb {K} }}
.
Für solche linearen Abbildungen gibt es einen eigenen Namen.
Wenn
G
⊆
K
n
{\displaystyle {}G\subseteq {\mathbb {K} }^{n}}
ist, so bilden die partiellen Ableitungen in einem Punkt
P
∈
G
{\displaystyle {}P\in G}
eine Matrix mit einer einzigen Zeile, die bei stetigen partiellen Ableitungen das totale Differential repräsentiert. Eine solche Matrix kann man aber ebenso auch als ein
n
{\displaystyle {}n}
-Tupel in
K
{\displaystyle {}{\mathbb {K} }}
und damit als einen Vektor in
K
n
{\displaystyle {}{\mathbb {K} }^{n}}
auffassen. Dieser Zusammenhang zwischen Vektoren und Linearformen beruht auf dem Standardskalarprodukt des
K
n
{\displaystyle {}{\mathbb {K} }^{n}}
, und lässt sich konzeptioneller mit Hilfe von Bilinearformen erfassen. Bilinearformen haben wir in Zusammenhang mit multilinearen Abbildungen und Skalarprodukten kennengelernt, sie sind spezielle
multilineare Abbildungen .
Es sei
K
{\displaystyle {}K}
ein
Körper
und
V
{\displaystyle {}V}
ein
K
{\displaystyle {}K}
-
Vektorraum . Eine Abbildung
V
×
V
⟶
K
,
(
v
,
w
)
⟼
⟨
v
,
w
⟩
,
{\displaystyle V\times V\longrightarrow K,\,(v,w)\longmapsto \left\langle v,w\right\rangle ,}
heißt Bilinearform , wenn für alle
v
∈
V
{\displaystyle {}v\in V}
die induzierten Abbildungen
V
⟶
K
,
w
⟼
⟨
v
,
w
⟩
,
{\displaystyle V\longrightarrow K,\,w\longmapsto \left\langle v,w\right\rangle ,}
und für alle
w
∈
V
{\displaystyle {}w\in V}
die induzierten Abbildungen
V
⟶
K
,
v
⟼
⟨
v
,
w
⟩
,
{\displaystyle V\longrightarrow K,\,v\longmapsto \left\langle v,w\right\rangle ,}
K
{\displaystyle {}K}
-
linear
sind.
Eine wichtige Eigenschaft von Bilinearformen, die Skalarprodukte erfüllen, wird in der nächsten Definition formuliert.
Es sei
K
{\displaystyle {}K}
ein
Körper
und
V
{\displaystyle {}V}
ein
K
{\displaystyle {}K}
-
Vektorraum . Eine
Bilinearform
V
×
V
⟶
K
,
(
v
,
w
)
⟼
⟨
v
,
w
⟩
,
{\displaystyle V\times V\longrightarrow K,\,(v,w)\longmapsto \left\langle v,w\right\rangle ,}
heißt nicht ausgeartet , wenn für alle
v
∈
V
,
v
≠
0
{\displaystyle {}v\in V,\,v\neq 0}
, die induzierten Abbildungen
V
⟶
K
,
w
⟼
⟨
v
,
w
⟩
,
{\displaystyle V\longrightarrow K,\,w\longmapsto \left\langle v,w\right\rangle ,}
und für alle
w
∈
V
,
w
≠
0
{\displaystyle {}w\in V,\,w\neq 0}
, die induzierten Abbildungen
V
⟶
K
,
v
⟼
⟨
v
,
w
⟩
,
{\displaystyle V\longrightarrow K,\,v\longmapsto \left\langle v,w\right\rangle ,}
nicht die
Nullabbildung
sind.
In der nächsten Vorlesung werden wir für Vektorräume, auf denen eine nicht-ausgeartete Bilinearform gegeben ist, eine bijektive Beziehung zwischen Vektoren und Linearformen beweisen und damit einen Zusammenhang zwischen dem totalen Differential zu einer Funktion in einem Punkt und einem Vektor, dem sogenannten Gradienten der Funktion in diesem Punkt, herstellen.
In einer topographischen Karte wird ein Gebirge durch seine Niveaulinien (Höhenlinien) repräsentiert.