Beweisteil 1: Eindimensionale Erweiterung des Funktionals
Bearbeiten
Sei nun
x
1
∈
V
∖
U
{\displaystyle x_{1}\in V\setminus U}
und
U
1
:=
{
λ
⋅
x
1
+
u
|
λ
∈
R
∧
u
∈
U
}
{\displaystyle U_{1}:=\{\lambda \cdot x_{1}+u\,|\,\lambda \in \mathbb {R} \,\wedge u\in U\}}
der von
x
1
{\displaystyle x_{1}}
und
U
{\displaystyle U}
erzeugte Untervektorraum. Das Funktional
f
:
U
→
R
{\displaystyle f:U\to \mathbb {R} }
wird nur auf
f
1
:
U
1
→
R
{\displaystyle f_{1}:U_{1}\to \mathbb {R} }
mit dem Definitionsbereich erweitert.
Beweisschritt 1.1: Eigenschaften Linearität
Bearbeiten
Unter der Ausnutzung der Eigenschaften der Linearität muss das gesuchte lineare Funktional
f
1
:
U
1
→
R
{\displaystyle f_{1}:U_{1}\to \mathbb {R} }
die folgende Eigenschaft für ein
x
=
λ
⋅
x
1
+
u
∈
U
1
{\displaystyle x=\lambda \cdot x_{1}+u\in U_{1}}
erfüllen:
f
1
(
x
)
=
f
1
(
λ
⋅
x
1
+
u
)
=
λ
⋅
f
1
(
x
1
)
+
f
1
(
u
)
=
λ
⋅
f
1
(
x
1
)
+
f
(
u
)
{\displaystyle f_{1}(x)=f_{1}(\lambda \cdot x_{1}+u)=\lambda \cdot f_{1}(x_{1})+f_{1}(u)=\lambda \cdot f_{1}(x_{1})+f(u)}
Die Aufgabe in Beweisteil 1 besteht also darin, ein
α
:=
f
1
(
x
1
)
∈
R
{\displaystyle \alpha :=f_{1}(x_{1})\in \mathbb {R} }
zu finden, das die Eigenschaft
f
1
(
x
)
≤
p
(
x
)
{\displaystyle f_{1}(x)\leq p(x)}
für alle
x
∈
U
1
{\displaystyle x\in U_{1}}
erfüllt.
Beweisschritt 1.2: Beschränktheit durch die Halbnorm
Bearbeiten
Für ein beliebiges
α
∈
R
{\displaystyle \alpha \in \mathbb {R} }
wird nun ein lineares Funktional
f
α
(
x
)
{\displaystyle f_{\alpha }(x)}
definiert mit:
f
α
(
x
)
=
λ
⋅
α
+
f
(
u
)
mit
x
=
λ
⋅
x
1
+
u
{\displaystyle f_{\alpha }(x)=\lambda \cdot \alpha +f(u){\mbox{ mit }}x=\lambda \cdot x_{1}+u}
Für alle
f
α
{\displaystyle f_{\alpha }}
gilt die Bedingung
f
α
|
U
=
f
{\displaystyle f_{\alpha }|_{U}=f}
. Das gesuchte
f
1
{\displaystyle f_{1}}
wird aus der Menge der lineare Funktionale
{
f
α
|
α
∈
R
}
{\displaystyle \{f_{\alpha }\,|\,\alpha \in \mathbb {R} \}}
bestimmt.
Beweisschritt 1.3: Beschränktheit durch die Halbnorm
Bearbeiten
Wenn ein lineares Funktional
f
α
(
x
)
{\displaystyle f_{\alpha }(x)}
die Eigenschaft
f
α
≤
p
|
U
1
{\displaystyle f_{\alpha }\leq p|_{U_{1}}}
erfüllt, gilt für alle
λ
∈
R
{\displaystyle \lambda \in \mathbb {R} }
die Bedingung:
f
α
(
x
)
=
f
α
(
λ
⋅
x
1
+
u
⏟
=
x
∈
U
1
)
=
λ
⋅
α
+
f
(
u
)
≤
p
(
λ
⋅
x
1
+
u
)
=
p
(
x
)
{\displaystyle f_{\alpha }(x)=f_{\alpha }(\underbrace {\lambda \cdot x_{1}+u} _{=x\in U_{1}})=\lambda \cdot \alpha +f(u)\leq p(\lambda \cdot x_{1}+u)=p(x)}
Beweisschritt 1.3: Beschränktheit durch die Halbnorm - Fallunterscheidnng
Bearbeiten
Wir betrachten nun diese Gleichung mit einer Fallunterscheidung für
λ
∈
R
{\displaystyle \lambda \in \mathbb {R} }
und
x
=
λ
⋅
x
1
+
u
∈
U
{\displaystyle x=\lambda \cdot x_{1}+u\in U}
Fall 1:
λ
=
0
{\displaystyle \lambda =0}
Fall 2:
λ
∈
R
+
{\displaystyle \lambda \in \mathbb {R} ^{+}}
Fall 3:
λ
∈
R
−
{\displaystyle \lambda \in \mathbb {R} ^{-}}
Beweisschritt 1.4: Beschränktheit durch die Halbnorm - Fall 1
Bearbeiten
Fall 1
λ
=
0
{\displaystyle \lambda =0}
: In diesem Fall ist
x
=
λ
⋅
x
1
+
u
=
u
∈
U
{\displaystyle x=\lambda \cdot x_{1}+u=u\in U}
und die Ungleichung
f
α
(
x
)
=
f
(
u
)
≤
p
(
u
)
=
p
(
x
)
{\displaystyle f_{\alpha }(x)=f(u)\leq p(u)=p(x)}
sogar für beliebige
α
∈
R
{\displaystyle \alpha \in \mathbb {R} }
Beweisschritt 1.5: Beschränktheit durch die Halbnorm - Fall 2
Bearbeiten
Fall 2
λ
∈
R
+
{\displaystyle \lambda \in \mathbb {R} ^{+}}
: Für
x
=
λ
⋅
x
1
+
u
∈
U
1
{\displaystyle x=\lambda \cdot x_{1}+u\in U_{1}}
und Multiplikation der Gleichung mit
1
λ
{\displaystyle {\frac {1}{\lambda }}}
erhält man die Ungleichung:
f
α
(
1
λ
x
)
=
f
α
(
x
1
+
1
λ
u
)
⏟
∈
U
1
=
α
+
f
(
1
λ
⋅
u
)
≤
p
(
x
1
+
1
λ
⋅
u
)
=
p
(
x
)
mit
1
λ
⋅
u
∈
U
{\displaystyle {\begin{array}{rcl}f_{\alpha }\left({\frac {1}{\lambda }}x\right)&=&f_{\alpha }\underbrace {\left(x_{1}+{\frac {1}{\lambda }}u\right)} _{\in U_{1}}=\alpha +f\left({\frac {1}{\lambda }}\cdot u\right)\\&\leq &p\left(x_{1}+{\frac {1}{\lambda }}\cdot u\right)=p(x){\mbox{ mit }}{\frac {1}{\lambda }}\cdot u\in U\end{array}}}
Damit erhält man
α
≤
p
(
x
1
+
1
λ
⋅
u
)
−
f
(
1
λ
⋅
u
)
{\displaystyle \alpha \leq p\left(x_{1}+{\frac {1}{\lambda }}\cdot u\right)-f\left({\frac {1}{\lambda }}\cdot u\right)}
bzw.
α
≤
p
(
x
1
+
u
)
−
f
(
u
)
{\displaystyle \alpha \leq p\left(x_{1}+u\right)-f\left(u\right)}
für alle
u
∈
U
{\displaystyle u\in U}
.
Beweisschritt 1.6: Beschränktheit durch die Halbnorm - Fall 3
Bearbeiten
Fall 3
λ
∈
R
−
{\displaystyle \lambda \in \mathbb {R} ^{-}}
Für
x
=
λ
⋅
x
1
+
u
∈
U
1
{\displaystyle x=\lambda \cdot x_{1}+u\in U_{1}}
und Multiplikation der Gleichung mit
−
1
λ
{\displaystyle -{\frac {1}{\lambda }}}
erhält man die Ungleichung:
p
(
−
1
λ
x
)
=
p
(
−
x
1
−
1
λ
u
)
≥
f
α
(
−
x
1
−
1
λ
u
)
⏟
=
−
1
λ
x
=
−
α
−
f
(
1
λ
⋅
u
)
mit
−
1
λ
⋅
u
∈
U
{\displaystyle {\mbox{ }}{\begin{array}{rcl}p\left(-{\frac {1}{\lambda }}x\right)&=&p\left(-x_{1}-{\frac {1}{\lambda }}u\right)\\&\geq &f_{\alpha }\underbrace {\left(-x_{1}-{\frac {1}{\lambda }}u\right)} _{=-{\frac {1}{\lambda }}x}=-\alpha -f\left({\frac {1}{\lambda }}\cdot u\right){\mbox{ mit }}-{\frac {1}{\lambda }}\cdot u\in U\end{array}}}
Damit erhält man
α
≥
−
p
(
−
x
1
−
1
λ
⋅
u
)
−
f
(
1
λ
⋅
u
)
{\displaystyle \alpha \geq -p\left(-x_{1}-{\frac {1}{\lambda }}\cdot u\right)-f\left({\frac {1}{\lambda }}\cdot u\right)}
bzw.
α
≥
−
p
(
−
x
1
−
u
~
)
−
f
(
u
~
)
{\displaystyle \alpha \geq -p\left(-x_{1}-{\tilde {u}}\right)-f\left({\tilde {u}}\right)}
für alle
u
~
∈
U
{\displaystyle {\tilde {u}}\in U}
.
Beweisschritt 1.7: Ungleichungskette für alpha
Bearbeiten
Die Fallunterscheidung liefert also folgende Ungleichungskette für
α
{\displaystyle \alpha }
, die ein gesuchtes lineares Funktional
f
α
{\displaystyle f_{\alpha }}
erfüllen für beliebige
u
,
u
~
∈
U
{\displaystyle u,{\tilde {u}}\in U}
erfüllen muss:
−
p
(
−
x
1
−
u
~
)
−
f
(
u
~
)
≤
α
≤
p
(
x
1
+
u
)
−
f
(
u
)
{\displaystyle -p\left(-x_{1}-{\tilde {u}}\right)-f\left({\tilde {u}}\right)\leq \alpha \leq p\left(x_{1}+u\right)-f\left(u\right)}
Da
α
∈
R
{\displaystyle \alpha \in \mathbb {R} }
fest gewählt werden muss, kann das nur extieren, wenn für alle
u
,
u
~
∈
U
{\displaystyle u,{\tilde {u}}\in U}
auch die folgenden Ungleichung gilt:
−
p
(
−
x
1
−
u
~
)
−
f
(
u
~
)
≤
p
(
x
1
+
u
)
−
f
(
u
)
{\displaystyle -p\left(-x_{1}-{\tilde {u}}\right)-f\left({\tilde {u}}\right)\leq p\left(x_{1}+u\right)-f\left(u\right)}
Beweisschritt 1.8: Ungleichungskette für Infimum und Supremum
Bearbeiten
Wir zeigen nun in 1.8. dass die folgenden Ungleichung für das Supremum
S
1
{\displaystyle S_{1}}
und Infimum
I
1
{\displaystyle I_{1}}
gilt:
S
1
:=
sup
u
~
∈
U
{
−
p
(
−
x
1
−
u
~
)
−
f
(
u
~
)
}
≤
inf
u
∈
U
{
p
(
x
1
+
u
)
−
f
(
u
)
}
=:
I
1
{\displaystyle S_{1}:=\sup _{{\tilde {u}}\in U}\{-p(-x_{1}-{\tilde {u}})-f({\tilde {u}})\}\leq \inf _{u\in U}\{p(x_{1}+u)-f(u)\}=:I_{1}}
Wenn diese Ungleichung gilt, kann das gesuchte
α
∈
R
{\displaystyle \alpha \in \mathbb {R} }
aus dem Intervall
[
S
1
,
I
1
]
{\displaystyle [S_{1},I_{1}]}
beliebig gewählt werden.
Bemerkung 1.8.0: Ungleichungskette für Infimum und Supremum
Bearbeiten
Das Supremum
S
1
{\displaystyle S_{1}}
und Infimum
I
1
{\displaystyle I_{1}}
wird bzgl.
U
1
{\displaystyle U_{1}}
gebildet und hängt damit von der Wahl von
U
{\displaystyle U}
und
x
1
{\displaystyle x_{1}}
ab.
Beweisschritt 1.8.1: Ungleichungskette für Infimum und Supremum
Bearbeiten
Für alle
u
,
u
~
∈
U
{\displaystyle u,{\tilde {u}}\in U}
gilt
f
(
u
)
−
f
(
u
~
)
=
f
(
u
−
u
~
)
mit Linearität und
f
≤
p
|
U
≤
p
(
u
−
u
~
)
=
p
(
u
−
u
~
+
x
1
−
x
1
⏟
=
0
)
=
p
(
(
u
+
x
1
)
+
(
−
u
~
−
x
1
)
)
≤
p
(
u
+
x
1
)
+
p
(
−
u
~
−
x
1
)
mit
Δ
-Ungleichung
{\displaystyle {\mbox{ }}{\begin{array}{rcl}f(u)-f({\tilde {u}})&=&f(u-{\tilde {u}}){\mbox{ mit Linearität und }}f\leq p|_{U}\\&\leq &p(u-{\tilde {u}})=p(u-{\tilde {u}}+\underbrace {x_{1}-x_{1}} _{=0})\\&=&p((u+x_{1})+(-{\tilde {u}}-x_{1}))\\&\leq &p(u+x_{1})+p(-{\tilde {u}}-x_{1}){\mbox{ mit }}\Delta {\mbox{-Ungleichung}}\end{array}}}
und man erhält
−
p
(
−
u
~
−
x
1
)
−
f
(
u
~
)
≤
p
(
x
1
+
u
)
−
f
(
u
)
{\displaystyle -p(-{\tilde {u}}-x_{1})-f({\tilde {u}})\leq p(x_{1}+u)-f(u)}
.
Beweisschritt 1.8.2: Ungleichungskette für Infimum und Supremum
Bearbeiten
Da die Aussage
−
p
(
−
u
~
−
x
1
)
−
f
(
u
~
)
≤
p
(
x
1
+
u
)
−
f
(
u
)
{\displaystyle -p(-{\tilde {u}}-x_{1})-f({\tilde {u}})\leq p(x_{1}+u)-f(u)}
für alle
u
,
u
~
∈
U
{\displaystyle u,{\tilde {u}}\in U}
gilt erhält man die Aussage ebenfalls für das Infimum und Supremum und
S
1
≤
I
1
{\displaystyle S_{1}\leq I_{1}}
mit:
S
1
:=
sup
u
~
∈
U
{
−
p
(
−
x
1
−
u
~
)
−
f
(
u
~
)
}
≤
inf
u
∈
U
{
p
(
x
1
+
u
)
−
f
(
u
)
}
=:
I
1
{\displaystyle S_{1}:=\sup _{{\tilde {u}}\in U}\{-p(-x_{1}-{\tilde {u}})-f({\tilde {u}})\}\leq \inf _{u\in U}\{p(x_{1}+u)-f(u)\}=:I_{1}}
Wähle nun ein beliebiges
α
∈
[
S
1
,
I
1
]
{\displaystyle \alpha \in [S_{1},I_{1}]}
und definiere die gesuchte Erweiterung
f
1
:
U
1
→
R
{\displaystyle f_{1}:U_{1}\to \mathbb {R} }
mit
f
1
(
x
)
=
f
(
λ
⋅
x
1
+
u
⏟
=
x
)
=
λ
⋅
α
+
f
(
u
)
{\displaystyle f_{1}(x)=f(\underbrace {\lambda \cdot x_{1}+u} _{=x})=\lambda \cdot \alpha +f(u)}
f
1
:
U
1
→
R
{\displaystyle f_{1}:U_{1}\to \mathbb {R} }
kann nur induktiv auf
f
2
:
U
2
→
R
{\displaystyle f_{2}:U_{2}\to \mathbb {R} }
erweitern und damit kann man immer weiter die Funktionale auf Obermenge von dem gegebenen
U
{\displaystyle U}
erweitert. Nun fehlt noch der zweite Beweisteil über das Lemma von Zorn, dass man in unendlichdimensionalen Vektorräume auch auf ganz
V
{\displaystyle V}
das lineare Funktional erweitern kann.
Beweisteil 2: Anwendung des Lemma von Zorn
Bearbeiten
Für die Anwendung des Lemmas von Zorn definiere wir zunächst ein Menge
E
{\displaystyle {\mathcal {E}}}
von Paaren
(
g
,
U
~
)
{\displaystyle (g,{\widetilde {U}})}
mit:
U
~
⊂
V
{\displaystyle {\widetilde {U}}\subset V}
ist eine Untervektorraum von
V
{\displaystyle V}
,
g
:
U
~
→
R
{\displaystyle g:{\widetilde {U}}\to \mathbb {R} }
ist ein lineares Funktional auf
U
~
{\displaystyle {\widetilde {U}}}
,
g
|
U
=
f
{\displaystyle g|_{U}=f}
und
g
≤
p
|
U
~
{\displaystyle g\leq p|_{\widetilde {U}}}
.
Beweisschritt 2.1: Definition partiellen Ordnung
Bearbeiten
Auf der Menge
E
{\displaystyle {\mathcal {E}}}
von Paaren
(
g
,
U
~
)
{\displaystyle (g,{\widetilde {U}})}
definiert man nun eine partielle Ordnung:
(
g
1
,
U
~
1
)
≺
(
g
2
,
U
~
2
)
:⟺
U
~
1
⊂
U
~
2
∧
g
2
|
U
~
1
=
g
1
{\displaystyle (g_{1},{\widetilde {U}}_{1})\prec (g_{2},{\widetilde {U}}_{2}):\Longleftrightarrow {\widetilde {U}}_{1}\subset {\widetilde {U}}_{2}\wedge g_{2}|_{{\widetilde {U}}_{1}}=g_{1}}
Beweisschritt 2.2: Eigenschaften der Menge
Bearbeiten
Die Menge
E
{\displaystyle {\mathcal {E}}}
von Paaren
(
g
,
U
~
)
{\displaystyle (g,{\widetilde {U}})}
besitzt folgende Eigenschaften:
E
≠
∅
{\displaystyle {\mathcal {E}}\not =\emptyset }
, da
(
f
,
U
)
∈
E
{\displaystyle (f,U)\in {\mathcal {E}}}
aus der Voraussetzung des Satzes die Eigenschaften erfüllt.
Für eine Kette
E
0
≠
∅
{\displaystyle {\mathcal {E}}_{0}\not =\emptyset }
mit
E
0
⊆
E
{\displaystyle {\mathcal {E}}_{0}\subseteq {\mathcal {E}}}
(d.h. es gibt eine totale Ordnung auf
E
0
{\displaystyle {\mathcal {E}}_{0}}
) kann z.B. über die sukzessive Erweiterungen
(
g
1
,
U
~
1
)
≺
(
g
2
,
U
~
2
)
≺
(
g
3
,
U
~
3
)
≺
.
.
.
{\displaystyle (g_{1},{\widetilde {U}}_{1})\prec (g_{2},{\widetilde {U}}_{2})\prec (g_{3},{\widetilde {U}}_{3})\prec ...}
ein Kette konstruieren.
Beweisschritt 2.3: Ketten haben obere Schranken
Bearbeiten
Wir zeigen nun, dass unter den oben genannte Voraussetzungen Ketten obere Schranken besitzen. Wenn diese Eigenschaften der partiell geordneten Menge gegeben ist, kann man das Lemma von Zorn auf
E
{\displaystyle {\mathcal {E}}}
anwenden.
Sei
E
0
≠
∅
{\displaystyle {\mathcal {E}}_{0}\not =\emptyset }
eine Kette und
M
:=
⋃
(
g
,
U
~
)
∈
E
0
U
~
⊆
V
{\displaystyle M:=\bigcup _{(g,{\widetilde {U}})\in {\mathcal {E}}_{0}}{\widetilde {U}}\subseteq V}
ist ein Untervektorraum von
V
{\displaystyle V}
.
Im Allgemeinen ist die Vereinigung von zwei Untervektorräumen nicht notwendigerweise wieder ein Untervektorraum. In diesem Fall gilt die Aussage aber, weil durch die vollständige Ordnung auf
E
0
{\displaystyle {\mathcal {E}}_{0}}
eine Mengeninklusion zwischen zwei beliebige Paare
(
g
1
,
U
~
1
)
≺
(
g
2
,
U
~
2
)
{\displaystyle (g_{1},{\widetilde {U}}_{1})\prec (g_{2},{\widetilde {U}}_{2})}
mit
U
~
1
⊂
U
~
2
{\displaystyle {\widetilde {U}}_{1}\subset {\widetilde {U}}_{2}}
und
g
2
|
U
~
1
=
g
1
{\displaystyle g_{2}|_{{\widetilde {U}}_{1}}=g_{1}}
gilt.
Beweisschritt 2.4: Definition eines Funktionals für obere Schranken
Bearbeiten
Mit
M
:=
⋃
(
g
,
U
~
)
∈
E
0
U
~
⊂
V
{\displaystyle M:=\bigcup _{(g,{\widetilde {U}})\in {\mathcal {E}}_{0}}{\widetilde {U}}\subset V}
ist ein Untervektorraum definiert für die Kette. Für eine obere Schranke der Kette benötigt man noch ein lineares Funktional
g
M
:
M
→
R
{\displaystyle g_{M}:M\to \mathbb {R} }
, das mit
(
g
M
,
M
)
{\displaystyle (g_{M},M)}
auch ein Element in
E
0
{\displaystyle {\mathcal {E}}_{0}}
ist:
Sei
x
∈
M
{\displaystyle x\in M}
, dann gibt es ein
(
g
,
U
~
)
∈
E
0
{\displaystyle (g,{\widetilde {U}})\in {\mathcal {E}}_{0}}
mit
x
∈
U
~
{\displaystyle x\in {\widetilde {U}}}
.
Definiere nun
g
M
(
x
)
:=
g
(
x
)
{\displaystyle g_{M}(x):=g(x)}
. Diese Definition ist u.a. durch die vollständige Ordnung auf
E
0
{\displaystyle {\mathcal {E}}_{0}}
wohldefiniert, da mit
(
g
1
,
U
~
1
)
≺
(
g
2
,
U
~
2
)
{\displaystyle (g_{1},{\widetilde {U}}_{1})\prec (g_{2},{\widetilde {U}}_{2})}
auch
g
2
|
U
~
1
=
g
1
{\displaystyle g_{2}|_{{\widetilde {U}}_{1}}=g_{1}}
erfüllt ist.
Beweisschritt 2.5: Maximale Elemente existieren
Bearbeiten
Mit dem Lemma von Zorn existieren nun maximale Elemente in
(
g
M
~
,
M
~
)
{\displaystyle (g_{\widetilde {M}},{\widetilde {M}})}
in
E
{\displaystyle {\mathcal {E}}}
. Wir nehmen nun an, dass ein solches maximales Element
(
g
M
~
,
M
~
)
{\displaystyle (g_{\widetilde {M}},{\widetilde {M}})}
die Eigenschaft besitzt, dass
M
~
≠
V
{\displaystyle {\widetilde {M}}\not =V}
wäre. Dann existiert aber ein
x
2
∈
V
∖
M
~
{\displaystyle x_{2}\in V\setminus {\widetilde {M}}}
, mit dem man
g
M
~
{\displaystyle g_{\widetilde {M}}}
auf eine Obermenge
U
~
2
⊂
V
{\displaystyle {\widetilde {U}}_{2}\subset V}
erweitert und analog zum Beweisteil 1 eine Paar
(
g
2
,
U
~
2
)
{\displaystyle (g_{2},{\widetilde {U}}_{2})}
definieren, das die Eigenschaft
(
g
M
~
,
M
~
)
≺
(
g
2
,
U
~
2
)
{\displaystyle (g_{\widetilde {M}},{\widetilde {M}})\prec (g_{2},{\widetilde {U}}_{2})}
erfüllt. Dies wäre aber ein Widerspruch zu der Annahme, dass
(
g
M
~
,
M
~
)
{\displaystyle (g_{\widetilde {M}},{\widetilde {M}})}
bereits maximal ist.
Zusammen mit Beweisteil 1 und 2 gilt nun die Behauptung des Satzes von Hahn-Banach im reelen Fall.
◻
{\displaystyle \square }