Kurs:Invariantentheorie (Osnabrück 2012-2013)/Vorlesung 1

Wir beginnen mit einigen typischen Beispielen zur Invariantentheorie.

Dreieckskongruenzen

Beispiel

Wir betrachten Dreiecke im ${}\mathbb {R} ^{2}$ . Die Ebene ${}\mathbb {R} ^{2}$ sei mit dem Standardskalarprodukt versehen, sodass wir Längen, Winkel und Flächeninhalte zur Verfügung haben. Eine affine Isometrie (oder eine Kongruenz) der Ebene ist eine Abbildung

\mathbb {R} ^{2}\longrightarrow \mathbb {R} ^{2}

der Form

P\mapsto AP+v,

wobei ${}A={\begin{pmatrix}a&b\\c&d\end{pmatrix}}$ eine lineare Isometrie ist, also durch eine orthogonale Matrix beschrieben wird, und wobei ${}v\in \mathbb {R} ^{2}$ ein (Verschiebungs)-Vektor ist. In Koordinaten liegt also die Abbildung

{\begin{pmatrix}x\\y\end{pmatrix}}\mapsto {\begin{pmatrix}a&b\\c&d\end{pmatrix}}{\begin{pmatrix}x\\y\end{pmatrix}}+{\begin{pmatrix}v_{1}\\v_{2}\end{pmatrix}}

vor. Orthogonal bedeutet, dass die Spaltenvektoren eine Orthonormalbasis bilden. Im zweidimensionalen bedeutet dies, dass entweder ${}A$ eine Drehmatrix

{}A={\begin{pmatrix}\operatorname {cos} \,\alpha &-\operatorname {sin} \,\alpha \\\operatorname {sin} \,\alpha &\operatorname {cos} \,\alpha \end{pmatrix}}\,

oder eine gespiegelte Drehmatrix (oder uneigentliche Drehmatrix)

{}A={\begin{pmatrix}\operatorname {cos} \,\alpha &\operatorname {sin} \,\alpha \\\operatorname {sin} \,\alpha &-\operatorname {cos} \,\alpha \end{pmatrix}}\,

ist. Zu den ebenen Kongruenzen gehören insbesondere Verschiebungen, Achsenspiegelungen, Punktspiegelungen und Drehungen, die auch aus der Schule bekannt sind. Diese Abbildungen erhalten allesamt das Skalarprodukt, Längen, Winkel (aber ohne die Orientierung) und Flächeninhalte.

Unter einem Dreieck in der Ebene verstehen wir einfach ein Tupel aus drei Punkten der Ebene, also ein geordnetes Tripel ${}{\left(P_{1},P_{2},P_{3}\right)}$ mit ${}P_{i}=\left(x_{i},\,y_{i}\right)$ . Die Dreieckspunkte sind also geordnet und wir erlauben auch degenerierte (oder ausgeartete) Dreiecke, beispielsweise können die Punkte kolinear sein oder auch zusammenfallen. Eine Kongruenz ${}g$ überführt ein Dreieck ${}\triangle$ in ein neues Dreieck, und zwar ist das Bilddreieck durch

{}g(\triangle )=g{\left(P_{1},P_{2},P_{3}\right)}={\left(g(P_{1}),g(P_{2}),g(P_{3})\right)}\,

definiert. Zwei Dreiecke ${}\triangle _{1}$ und ${}\triangle _{2}$ heißen geordnet kongruent, wenn es eine Kongruenz gibt, die das eine Dreieck in das andere überführt (bei einer nicht geordneten Kongruenz kann man noch die Nummerierung der Punkte ändern). Die (geordnete) Kongruenz von Dreiecken ist eine Äquivalenzrelation. Unter einer Kongruenz bleiben diejenigen Größen eines Dreiecks erhalten, die generell unter einer Kongruenz erhalten bleiben, also der Flächeninhalt, die Länge der Seiten, und daraus abgeleitete Größen wie der Umfang des Dreiecks, die Länge der kleinsten Seite, usw., dagegen werden andere Größen des Dreiecks verändert, seine Lage im Raum, die Koordinaten seiner Punkte.

Da ein Dreieck durch die Koordinaten seiner Eckpunkte vollständig beschrieben wird, müssen alle dem Dreieck zugeordneten Größen als eine Funktion der sechs Koordinaten ${}\left(x_{1},\,y_{1},\,x_{2},\,y_{2},\,x_{3},\,y_{3}\right)$ ausdrückbar sein. Eine Größe ist also einfach eine zunächst beliebige Funktion

\mu \colon \mathbb {R} ^{6}\longrightarrow \mathbb {R} ,\,\triangle \longmapsto \mu (\triangle ),

(man kann auch andere Wertebereiche zulassen). Man sagt, dass eine solche Funktion nur von der Kongruenzklasse abhängt oder invariant unter der Kongruenz ist, wenn für jedes Dreieck ${}\triangle \in \mathbb {R} ^{6}$ und jede Kongruenz ${}g$ die Gleichheit

{}\mu (\triangle )=\mu (g(\triangle ))\,

gilt. Eine solche invariante Funktion nennt man auch eine innere Größe des Dreiecks, da sie nicht von der Lage des Dreiecks in der Ebene abhängt (wobei man sowohl die invariante Funktion als auch den Wert einer solchen an einem bestimmten Dreieck als innere Größe bezeichnet).

Der Flächeninhalt (vergleiche Aufgabe 1.1; man verschiebe den Eckpunkt $(x_{3},y_{3})$ des Dreiecks in den Nullpunkt und betrachte dann die daran anliegenden Seiten als Vektoren) des Dreiecks wird durch

{}{\begin{aligned}\mu (\triangle )&={\frac {1}{2}}\vert {\det {\begin{pmatrix}x_{1}-x_{3}&x_{2}-x_{3}\\y_{1}-y_{3}&y_{2}-y_{3}\end{pmatrix}}}\vert \\&={\frac {1}{2}}\vert {{\left(x_{1}-x_{3}\right)}{\left(y_{2}-y_{3}\right)}-{\left(y_{1}-y_{3}\right)}{\left(x_{2}-x_{3}\right)}}\vert \\&={\frac {1}{2}}\vert {x_{1}y_{2}-x_{2}y_{1}-x_{1}y_{3}+x_{3}y_{1}-x_{3}y_{2}+x_{2}y_{3}}\vert \end{aligned}}

gegeben. Aufgrund der inhaltlichen Interpretation als Flächeninhalt eines Dreiecks muss es sich um eine innere Größe handeln. Dies lässt sich aber auch rechnerisch überprüfen. Um den Rechenaufwand zu minimieren, sind folgende einfache Vorüberlegungen sinnvoll:

Wenn eine Funktion ${}\mu$ invariant ist, so ist auch jede Funktion invariant, die nur von dieser Funktion abhängt; wenn also der Ausdruck

${}\nu (\triangle )=x_{1}y_{2}-x_{2}y_{1}-x_{1}y_{3}+x_{3}y_{1}-x_{3}y_{2}+x_{2}y_{3}$ unter einer bestimmten Kongruenz invariant ist, so ist insbesondere auch der Betrag davon unter dieser Kongruenz invariant.

Da man jede Kongruenz als

Hintereinanderschaltung von besonders einfachen Kongruenzen schreiben kann, nämlich von Verschiebungen, Drehungen und eventuell einer Spiegelung an der ${}x$ -Achse, genügt es, die Invarianz unter diesen erzeugenden Kongruenzen zu zeigen.

Betrachten wir also diese speziellen Kongruenzen. Bei einer Verschiebung ${}g$ um den Vektor ${}\left(w,\,z\right)$ ist

{}{\begin{aligned}\nu (g(\triangle ))&=\nu \left(x_{1}+w,\,y_{1}+z,\,x_{2}+w,\,y_{2}+z,\,x_{3}+w,\,y_{3}+z\right)\\&=\det {\begin{pmatrix}x_{1}-w-{\left(x_{3}-w\right)}&x_{2}-w-{\left(x_{3}-w\right)}\\y_{1}-z-{\left(y_{3}-z\right)}&y_{2}-z-{\left(y_{3}-z\right)}\end{pmatrix}}\\&=\det {\begin{pmatrix}x_{1}-x_{3}&x_{2}-x_{3}\\y_{1}-y_{3}&y_{2}-y_{3}\end{pmatrix}}\\&=\nu (\triangle ).\end{aligned}}

Für eine Drehung ${}D$ um den Winkel ${}\alpha$ und einen Vektor ${}v\in V$ und die zugehörige Verschiebung ${}V_{v}$ gilt ${}V_{-D(v)}\circ D\circ V_{v}=D$ . Da wir die Invarianz unter einer Verschiebung schon bewiesen haben, können wir annehmen, dass der dritte Eckpunkt der Nullpunkt ist, dass also ${}(x_{3},y_{3})=(0,0)$ ist. Damit ist aufgrund des Determinantenmultiplikationssatzes

{}{\begin{aligned}\nu (D(\triangle ))&=\det {\left({\begin{pmatrix}\operatorname {cos} \,\alpha &-\operatorname {sin} \,\alpha \\\operatorname {sin} \,\alpha &\operatorname {cos} \,\alpha \end{pmatrix}}{\begin{pmatrix}x_{1}&x_{2}\\y_{1}&y_{2}\end{pmatrix}}\right)}\\&=\det {\begin{pmatrix}\operatorname {cos} \,\alpha &-\operatorname {sin} \,\alpha \\\operatorname {sin} \,\alpha &\operatorname {cos} \,\alpha \end{pmatrix}}\det {\begin{pmatrix}x_{1}&x_{2}\\y_{1}&y_{2}\end{pmatrix}}\\&=\det {\begin{pmatrix}x_{1}&x_{2}\\y_{1}&y_{2}\end{pmatrix}}\\&=\nu (\triangle ).\end{aligned}}

Für die Spiegelung ${}S={\begin{pmatrix}1&0\\0&-1\end{pmatrix}}$ ist schließlich

{}\nu (S(\triangle ))=\nu {\left({\begin{pmatrix}1&0\\0&-1\end{pmatrix}}{\begin{pmatrix}x_{1}-x_{3}&x_{2}-x_{3}\\y_{1}-y_{3}&y_{2}-y_{3}\end{pmatrix}}\right)}=-\nu (\triangle )\,.

Die Funktion ${}\nu$ ist also nicht invariant unter der Spiegelung, wohl aber ihr Betrag oder das Quadrat davon (letzteres gilt über jedem Körper). Die Funktion ${}\nu$ (oder $\nu ^{2}$ oder $\vert {\nu }\vert$ ) enthält auch die Information, ob das Dreieck ausgeartet ist oder nicht, nämlich genau dann, wenn ${}\nu$ den Wert ${}0$ annimmt.

Betrachten wir die Seitenlängen. Da wir mit geordneten Dreiecken arbeiten, sind (für ${}i\neq j$ ) die Seitenlängen

{}L_{ij}={\sqrt {{\left(x_{i}-x_{j}\right)}^{2}+{\left(y_{i}-y_{j}\right)}^{2}}}\,

invariant unter Kongruenzen (sie sind nicht invariant unter Umnummerierungen, da diese ja beispielsweise $L_{12}$ in $L_{13}$ überführen). Der Ausdruck ${}U=L_{12}+L_{13}+L_{23}$ , also der Umfang, ist invariant unter den Kongruenzen, aber auch unter Umnummerierungen.

Die Invarianz der Seitenlängen ist ein Spezialfall der Invarianz der Skalarprodukte. Isometrien erhalten das Skalarprodukt, dies ist ihre definierende Eigenschaft. Zu ${}i\neq j$ (und ${}k$ die dritte Zahl aus $\{1,2,3\}$ ) sei

{}{\begin{aligned}S_{ij}&:=\left\langle {\begin{pmatrix}x_{i}-x_{k}\\y_{i}-y_{k}\end{pmatrix}},{\begin{pmatrix}x_{j}-x_{k}\\y_{j}-y_{k}\end{pmatrix}}\right\rangle \\&={\left(x_{i}-x_{k}\right)}{\left(x_{j}-x_{k}\right)}+{\left(y_{i}-y_{k}\right)}{\left(y_{j}-y_{k}\right)}\\&=x_{i}x_{j}-x_{i}x_{k}-x_{j}x_{k}+x_{k}^{2}+y_{i}y_{j}-y_{i}y_{k}-y_{j}y_{k}+y_{k}^{2}.\end{aligned}}

Das ist also das Skalarprodukt der beiden vektoriellen Seiten, die am Eckpunkt ${}P_{k}$ anliegen. Diese Funktionen sind invariant unter geordneten Kongruenzen. Die Invarianz der Winkel (an einer bestimmten Ecke) zwischen zwei Dreiecksseiten folgt direkt aus der Invarianz der Skalarprodukte der zwei Seiten.

Es gibt eine Reihe von elementargeometrischen Sätzen, die besagen, dass ein Dreieck bis auf Kongruenz durch die Angabe gewisser Größen bestimmt ist, z.B. durch die Angabe der drei Seitenlängen oder die Angabe eines Winkels und der Längen der beiden anliegenden Seiten. Betrachten wir die drei Längen als Abbildung (die wir die Längenabbildung nennen)

L\colon \mathbb {R} ^{6}\longrightarrow \mathbb {R} ^{3},\,\triangle \longmapsto \left(L_{12}(\triangle ),\,L_{13}(\triangle ),\,L_{23}(\triangle )\right).

Zwei Dreiecke sind genau dann kongruent, wenn ihre Werte unter der Abbildung ${}L$ übereinstimmen. Die Faser der Abbildung über einem Längentupel ${}\ell _{1},\ell _{2},\ell _{3}$ besteht aus allen geordneten Dreiecken, deren Seitenlängen gleich ${}\ell _{i}$ sind. Die Abbildung ist nicht surjektiv, da das Längentupel eines Dreiecks in ${}\mathbb {R} _{\geq 0}^{3}$ liegt und die Dreiecksungleichung ${}\ell _{1}\leq \ell _{2}+\ell _{3}$ (und Permutationen davon) erfüllen muss (über einem algebraisch abgeschlossenen Körper ist die Abbildung aber surjektiv). Wenn ${}\mu \colon \mathbb {R} ^{6}\rightarrow \mathbb {R}$ irgendeine invariante Funktion ist, so ist diese auf den Kongruenzklassen, also den Fasern von ${}L$ , konstant, und somit gibt es eine eindeutig bestimmte Funktion ${}{\tilde {\mu }}\colon \mathbb {R} ^{3}\rightarrow \mathbb {R}$ mit ${}\mu ={\tilde {\mu }}\circ L$ . In einem gewissen Sinn beschreiben die ${}L_{ij}$ sämtliche invarianten Funktionen.

Symmetrische Polynome

Definition

Es sei ${}K$ ein Körper. Ein Polynom ${}f\in K[X_{1},\ldots ,X_{n}]$ heißt symmetrisch, wenn für jede Permutation ${}\sigma \in S_{n}$ die Gleichheit

{}f=f^{\sigma }\,

besteht, wobei ${}f^{\sigma }$ aus ${}f$ entsteht, indem man überall in ${}f$ die Variable ${}X_{i}$ durch ${}X_{\sigma (i)}$ ersetzt.^[1]

Beispiel

Bei ${}n=1$ sind alle Polynome symmetrisch, da dort allein die Identität vorliegt. Bei ${}n=2$ sind die Konstanten und beispielsweise ${}x+y,xy,5+x+y,3x+3y+x^{2}y^{2}$ symmetrische Polynome. Bei ${}n=3$ sind ${}x+y+z,\,xy+xz+yz,\,xyz,\,x^{4}+y^{4}+z^{4}$ typische Beispiele.

Die Summe und das Produkt von symmetrischen Polynomen ist wieder symmetrisch, daher bilden die symmetrischen Polynome einen Unterring des Polynomringes.

Definition

Das ${}i$ -te elementarsymmetrische Polynom in ${}n$ Variablen ist das Polynom (mit ${}i=1,\ldots ,n$ )

{}E_{i}:=\sum _{1\leq k_{1}<\ldots <k_{i}\leq n}X_{k_{1}}\cdots X_{k_{i}}\,.

Die elementarsymmetrischen Polynome treten in folgender Situation auf.

Bemerkung

Wir betrachten das Produkt

(T+X_{1})\cdots (T+X_{n})

in ${}K[X_{1},\ldots ,X_{n},T]=K[X_{1},\ldots ,X_{n}][T]$ . Wenn man dieses Produkt ausmultipliziert, so erhält man ein (normiertes) Polynom in ${}T$ vom Grad ${}n$ , wobei die Koeffizienten selbst Polynome aus ${}K[X_{1},\ldots ,X_{n}]$ sind. Da man beim Ausmultiplizieren alles mit allem multiplizieren muss, gilt

(T+X_{1})\cdots (T+X_{n})=T^{n}+E_{1}T^{n-1}+\cdots +E_{n}T^{0}\,,

wobei ${}E_{i}$ gerade das ${}i$ -te elementarsymmetrische Polynom bezeichnet. Ein Polynom in ${}T$ mit den Nullstellen ${}-X_{i}$ besitzt also die elementarsymmetrischen Polynome als Koeffizienten.

Mit Hilfe der elementarsymmetrischen Polynome kann man nun einfach alle symmetrischen Polynome in eindeutiger Form schreiben. Dies ist der Inhalt des Hauptsatzes über symmetrische Polynome. Für den Beweis benötigen wir den Begriff der gradlexikographischen Ordnung.

Definition

Es sei ${}K$ ein Körper und ${}K[X_{1},\ldots ,X_{n}]$ der Polynomring über ${}K$ . Die gradlexikographische Ordnung auf der Menge der Monome ist durch

X_{1}^{a_{1}}\cdots X_{n}^{a_{n}}\prec X_{1}^{b_{1}}\cdots X_{n}^{b_{n}},

falls der Grad von ${}X_{1}^{a_{1}}\cdots X_{n}^{a_{n}}$ , (also ${}\sum _{i=1}^{n}a_{i}$ ), kleiner als der Grad von ${}X_{1}^{b_{1}}\cdots X_{n}^{b_{n}}$ ist, oder, bei gleichem Grad, wenn ${}a_{1}=b_{1},\ldots ,a_{k}=b_{k}$ , aber ${}a_{k+1}<b_{k+1}$ ist, gegeben.

Man verwendet also die Ordnung auf der Variablenmenge. Man vergleicht zwei Monome ${}f$ und ${}g$ , indem man zuerst den Grad miteinander vergleicht. Stimmt dieser überein, so vergleicht man die Exponenten der ersten Variable der beiden Monome miteinander (man vergleicht also den „Anfangsbuchstaben“). Wenn es hier einen Größenunterschied gibt, so ist die Sache entschieden. Andernfalls schaut man sich den Exponenten der zweiten Variablen an, und so weiter. Dies führt zu einer totalen Ordung auf der Menge der Monome. Zu einem Monom gibt es jeweils nur endlich viele Monome, die bezüglich dieser Ordnung kleiner sind. Daher kann man über diese Ordnung Induktion führen.

Zu einem Polynom ${}f$ nennt man das Monom aus ${}f$ (mit einem Koeffizienten ${}\neq 0$ ) mit dem größten Exponententupel in der gradlexikographischen Ordnung das Leitmonom von ${}f$ .

Satz

Jedes symmetrische Polynom ${}F\in K[X_{1},\ldots ,X_{n}]$ lässt sich

eindeutig als Polynom in den elementarsymmetrischen Polynomen schreiben.

D.h. es ist

{}F=\sum _{\nu }a_{\nu }E^{\nu }\,

mit eindeutig bestimmten Koeffizienten ${}a_{\nu }\in K$ .

Beweis

Wir führen Induktion über die gradlexikographische Ordnung. Zur Existenz. Es sei ${}F$ ein symmetrisches Polynom. Es sei ${}X_{1}^{a_{1}}\cdots X_{n}^{a_{n}}$ das Leitmonom von ${}F$ (mit dem Koeffizienten ${}c\neq 0$ ) Es ist ${}a_{i+1}\leq a_{i}$ für alle ${}i$ . Andernfalls nämlich betrachtet man die Permutation, die ${}X_{i+1}$ und ${}X_{i}$ vertauscht. Das resultierende Monom muss wegen der Symmetrie ebenfalls in ${}F$ vorkommen, wäre aber größer in der gradlexikographischen Ordnung.

Wir betrachten das Polynom

{}G=F-cE_{1}^{a_{1}-a_{2}}E_{2}^{a_{2}-a_{3}}\cdots E_{n-1}^{a_{n-1}-a_{n}}E_{n}^{a_{n}}\,.

Dabei treten rechts die elementarsymmetrischen Polynome mit nichtnegativen Exponenten auf. Das Polynom rechts enthält ebenfalls ${}X_{1}^{a_{1}}\cdots X_{n}^{a_{n}}$ als Leitmonom: Hierzu muss man sich die Monome in ${}E_{i}$ klar machen. Das Leitmonom von ${}E_{i}$ ist ${}X_{1}\cdots X_{i}$ und das Leitmonom von ${}E_{i}^{k}$ ist ${}(X_{1}\cdots X_{i})^{k}$ (das Leitmonom ist multiplikativ, siehe Aufgabe 1.10). Daher hat das Polynom rechts das Leitmonom

X_{1}^{a_{1}-a_{2}}\cdot (X_{1}X_{2})^{a_{2}-a_{3}}\cdots (X_{1}\cdots X_{n-1})^{a_{n-1}-a_{n}}\cdot (X_{1}\cdots X_{n})^{a_{n}}=X_{1}^{a_{1}}X_{2}^{a_{2}}\cdots X_{n-1}^{a_{n-1}}X_{n}^{a_{n}}\,.

In der Differenz ${}G$ verschwindet also dieses Monom, d.h. ${}G$ hat einen kleineren Grad in der gradlexikographischen Ordung. Da ${}G$ ebenfalls symmetrisch ist, liefert die Induktionsvoraussetzung die Behauptung.
Zur Eindeutigkeit. Wir zeigen, dass die elementarsymmetrischen Polynome algebraisch unabhängig sind. Es sei also

{}H(E_{1},\ldots ,E_{n})=0\,,

wobei ${}H\neq 0$ ein Polynom in den ${}n$ Variablen ${}Y_{1},\ldots ,Y_{n}$ sei. Wir schreiben ${}H$ als Summe von Monomen der Form

Y_{1}^{a_{1}-a_{2}}Y_{2}^{a_{2}-a_{3}}\cdots Y_{n}^{a_{n}}

mit ${}a_{1}\geq \ldots \geq a_{n}$ . Es sei ${}(a_{1},\ldots ,a_{n})$ dasjenige Tupel mit

{}a_{i}\geq a_{i+1}\,,

das in der gradlexikographischen Ordnung maximal ist unter allen Tupeln, für die ${}Y_{1}^{a_{1}-a_{2}}Y_{2}^{a_{2}-a_{3}}\cdots Y_{n}^{a_{n}}$ in ${}H$ vorkommt (es werden also die ${}a$ verglichen, nicht die Differenzen). Dann besitzt ${}H(E_{1},\ldots ,E_{n})$ als Polynom in ${}X$ das Leitmonom ${}X_{1}^{a_{1}}\cdots X_{n}^{a_{n}}$ und wäre nicht ${}0$ .

\Box

Insbesondere ist der Ring der symmetrischen Polynome selbst isomorph zu einem Polynomring in ${}n$ Variablen.

Fußnoten

↑ Wenn man die durch eine Permutation induzierte lineare Abbildung
$K^{n}\longrightarrow K^{n},\,e_{i}\longmapsto e_{\sigma (i)},$

betrachtet, so ist es natürlicher, die ${}i$ -te Variable ${}X_{i}$ , die ja die ${}i$ -te Projektion von ${}K^{n}$ auf ${}K$ bezeichnet, auf ${}X_{i}\circ \sigma$ , also auf ${}X_{\sigma ^{-1}(i)}$ , abzubilden.

Kurs:Invariantentheorie (Osnabrück 2012-2013) | >>

PDF-Version dieser Vorlesung

Arbeitsblatt zur Vorlesung (PDF)

[1] Wenn man die durch eine Permutation induzierte lineare Abbildung
$K^{n}\longrightarrow K^{n},\,e_{i}\longmapsto e_{\sigma (i)},$

betrachtet, so ist es natürlicher, die ${}i$ -te Variable ${}X_{i}$ , die ja die ${}i$ -te Projektion von ${}K^{n}$ auf ${}K$ bezeichnet, auf ${}X_{i}\circ \sigma$ , also auf ${}X_{\sigma ^{-1}(i)}$ , abzubilden.

[1]