Kurs:Invariantentheorie (Osnabrück 2012-2013)/Vorlesung 1

Wir beginnen mit einigen typischen Beispielen zur Invariantentheorie.



Dreieckskongruenzen

Beispiel  

Wir betrachten Dreiecke im . Die Ebene sei mit dem Standardskalarprodukt versehen, so dass wir Längen, Winkel und Flächeninhalte zur Verfügung haben. Eine affine Isometrie (oder eine Kongruenz) der Ebene ist eine Abbildung

der Form

wobei eine lineare Isometrie ist, also durch eine orthogonale Matrix beschrieben wird, und wobei ein (Verschiebungs)-Vektor ist. In Koordinaten liegt also die Abbildung

vor. Orthogonal bedeutet, dass die Spaltenvektoren eine Orthonormalbasis bilden. Im zweidimensionalen bedeutet dies, dass entweder eine Drehmatrix

oder eine gespiegelte Drehmatrix (oder uneigentliche Drehmatrix)

ist. Zu den ebenen Kongruenzen gehören insbesondere Verschiebungen, Achsenspiegelungen, Punktspiegelungen und Drehungen, die auch aus der Schule bekannt sind. Diese Abbildungen erhalten allesamt das Skalarprodukt, Längen, Winkel (aber ohne die Orientierung) und Flächeninhalte.

Unter einem Dreieck in der Ebene verstehen wir einfach ein Tupel aus drei Punkten der Ebene, also ein geordnetes Tripel mit . Die Dreieckspunkte sind also geordnet und wir erlauben auch degenerierte (oder ausgeartete) Dreiecke, beispielsweise können die Punkte kolinear sein oder auch zusammenfallen. Eine Kongruenz überführt ein Dreieck in ein neues Dreieck, und zwar ist das Bilddreieck durch

definiert. Zwei Dreiecke  und heißen geordnet kongruent, wenn es eine Kongruenz gibt, die das eine Dreieck in das andere überführt (bei einer nicht geordneten Kongruenz kann man noch die Nummerierung der Punkte ändern). Die (geordnete) Kongruenz von Dreiecken ist eine Äquivalenzrelation. Unter einer Kongruenz bleiben diejenigen Größen eines Dreiecks erhalten, die generell unter einer Kongruenz erhalten bleiben, also der Flächeninhalt, die Länge der Seiten, und daraus abgeleitete Größen wie der Umfang des Dreiecks, die Länge der kleinsten Seite, usw., dagegen werden andere Größen des Dreiecks verändert, seine Lage im Raum, die Koordinaten seiner Punkte.

Da ein Dreieck durch die Koordinaten seiner Eckpunkte vollständig beschrieben wird, müssen alle dem Dreieck zugeordneten Größen als eine Funktion der sechs Koordinaten ausdrückbar sein. Eine Größe ist also einfach eine zunächst beliebige Funktion

(man kann auch andere Wertebereiche zulassen). Man sagt, dass eine solche Funktion nur von der Kongruenzklasse abhängt oder invariant unter der Kongruenz ist, wenn für jedes Dreieck und jede Kongruenz die Gleichheit

gilt. Eine solche invariante Funktion nennt man auch eine innere Größe des Dreiecks, da sie nicht von der Lage des Dreiecks in der Ebene abhängt (wobei man sowohl die invariante Funktion als auch den Wert einer solchen an einem bestimmten Dreieck als innere Größe bezeichnet).

Der Flächeninhalt (vergleiche Aufgabe 1.1; man verschiebe den Eckpunkt des Dreiecks in den Nullpunkt und betrachte dann die daran anliegenden Seiten als Vektoren) des Dreiecks wird durch

gegeben. Aufgrund der inhaltlichen Interpretation als Flächeninhalt eines Dreiecks muss es sich um eine innere Größe handeln. Dies lässt sich aber auch rechnerisch überprüfen. Um den Rechenaufwand zu minimieren, sind folgende einfache Vorüberlegungen sinnvoll:

    • Wenn eine Funktion invariant ist, so ist auch jede Funktion invariant, die nur von dieser Funktion abhängt; wenn also der Ausdruck

    unter einer bestimmten Kongruenz invariant ist, so ist insbesondere auch der Betrag davon unter dieser Kongruenz invariant.

    • Da man jede Kongruenz als

    Hintereinanderschaltung von besonders einfachen Kongruenzen schreiben kann, nämlich von Verschiebungen, Drehungen und eventuell einer Spiegelung an der -Achse, genügt es, die Invarianz unter diesen erzeugenden Kongruenzen zu zeigen.

    Betrachten wir also diese speziellen Kongruenzen. Bei einer Verschiebung um den Vektor ist

    Für eine Drehung um den Winkel und einen Vektor und die zugehörige Verschiebung gilt . Da wir die Invarianz unter einer Verschiebung schon bewiesen haben, können wir annehmen, dass der dritte Eckpunkt der Nullpunkt ist, dass also ist. Damit ist aufgrund des Determinantenmultiplikationssatzes

    Für die Spiegelung ist schließlich

    Die Funktion ist also nicht invariant unter der Spiegelung, wohl aber ihr Betrag oder das Quadrat davon (letzteres gilt über jedem Körper). Die Funktion (oder oder ) enthält auch die Information, ob das Dreieck ausgeartet ist oder nicht, nämlich genau dann, wenn den Wert annimmt.

    Betrachten wir die Seitenlängen. Da wir mit geordneten Dreiecken arbeiten, sind (für ) die Seitenlängen

    invariant unter Kongruenzen (sie sind nicht invariant unter Umnummerierungen, da diese ja beispielsweise in überführen). Der Ausdruck , also der Umfang, ist invariant unter den Kongruenzen, aber auch unter Umnummerierungen.

    Die Invarianz der Seitenlängen ist ein Spezialfall der Invarianz der Skalarprodukte. Isometrien erhalten das Skalarprodukt, dies ist ihre definierende Eigenschaft. Zu (und die dritte Zahl aus ) sei

    Das ist also das Skalarprodukt der beiden vektoriellen Seiten, die am Eckpunkt anliegen. Diese Funktionen sind invariant unter geordneten Kongruenzen. Die Invarianz der Winkel (an einer bestimmten Ecke) zwischen zwei Dreiecksseiten folgt direkt aus der Invarianz der Skalarprodukte der zwei Seiten.

    Es gibt eine Reihe von elementargeometrischen Sätzen, die besagen, dass ein Dreieck bis auf Kongruenz durch die Angabe gewisser Größen bestimmt ist, z.B. durch die Angabe der drei Seitenlängen oder die Angabe eines Winkels und der Längen der beiden anliegenden Seiten. Betrachten wir die drei Längen als Abbildung (die wir die Längenabbildung nennen)

    Zwei Dreiecke sind genau dann kongruent, wenn ihre Werte unter der Abbildung übereinstimmen. Die Faser der Abbildung über einem Längentupel besteht aus allen geordneten Dreiecken, deren Seitenlängen gleich sind. Die Abbildung ist nicht surjektiv, da das Längentupel eines Dreiecks in liegt und die Dreiecksungleichung (und Permutationen davon) erfüllen muss (über einem algebraisch abgeschlossenen Körper ist die Abbildung aber surjektiv). Wenn irgendeine invariante Funktion ist, so ist diese auf den Kongruenzklassen, also den Fasern von , konstant, und somit gibt es eine eindeutig bestimmte Funktion mit . In einem gewissen Sinn beschreiben die sämtliche invarianten Funktionen.




    Symmetrische Polynome

    Definition  

    Es sei ein Körper. Ein Polynom heißt symmetrisch, wenn für jede Permutation die Gleichheit

    besteht, wobei aus entsteht, indem man überall in die Variable durch ersetzt.[1]


    Beispiel  

    Bei sind alle Polynome symmetrisch, da dort allein die Identität vorliegt. Bei sind die Konstanten und beispielsweise symmetrische Polynome. Bei sind typische Beispiele.


    Die Summe und das Produkt von symmetrischen Polynomen ist wieder symmetrisch, daher bilden die symmetrischen Polynome einen Unterring des Polynomringes.


    Definition  

    Das -te elementarsymmetrische Polynom in Variablen ist das Polynom (mit )

    Die elementarsymmetrischen Polynome treten in folgender Situation auf.

    Bemerkung  

    Wir betrachten das Produkt

    in . Wenn man dieses Produkt ausmultipliziert, so erhält man ein (normiertes) Polynom in vom Grad , wobei die Koeffizienten selbst Polynome aus sind. Da man beim Ausmultiplizieren alles mit allem multiplizieren muss, gilt

    wobei gerade das -te elementarsymmetrische Polynom bezeichnet. Ein Polynom in mit den Nullstellen besitzt also die elementarsymmetrischen Polynome als Koeffizienten.


    Mit Hilfe der elementarsymmetrischen Polynome kann man nun einfach alle symmetrischen Polynome in eindeutiger Form schreiben. Dies ist der Inhalt des Hauptsatzes über symmetrische Polynome. Für den Beweis benötigen wir den Begriff der gradlexikographischen Ordnung.


    Definition  

    Es sei ein Körper und der Polynomring über . Die gradlexikographische Ordnung auf der Menge der Monome ist durch

    falls der Grad von , (also ), kleiner als der Grad von ist, oder, bei gleichem Grad, wenn , aber ist, gegeben.

    Man verwendet also die Ordnung auf der Variablenmenge. Man vergleicht zwei Monome und , indem man zuerst den Grad miteinander vergleicht. Stimmt dieser überein, so vergleicht man die Exponenten der ersten Variable der beiden Monome miteinander (man vergleicht also den „Anfangsbuchstaben“). Wenn es hier einen Größenunterschied gibt, so ist die Sache entschieden. Andernfalls schaut man sich den Exponenten der zweiten Variablen an, und so weiter. Dies führt zu einer totalen Ordung auf der Menge der Monome. Zu einem Monom gibt es jeweils nur endlich viele Monome, die bezüglich dieser Ordnung kleiner sind. Daher kann man über diese Ordnung Induktion führen.

    Zu einem Polynom nennt man das Monom aus (mit einem Koeffizienten ) mit dem größten Exponententupel in der gradlexikographischen Ordnung das Leitmonom von .



    Satz  

    Jedes symmetrische Polynom lässt sich

    eindeutig als Polynom in den elementarsymmetrischen Polynomen schreiben.

    D.h. es ist

    mit eindeutig bestimmten Koeffizienten .

    Beweis  

    Wir führen Induktion über die gradlexikographische Ordnung. Zur Existenz. Es sei ein symmetrisches Polynom. Es sei das Leitmonom von (mit dem Koeffizienten ) Es ist für alle . Andernfalls nämlich betrachtet man die Permutation, die und vertauscht. Das resultierende Monom muss wegen der Symmetrie ebenfalls in vorkommen, wäre aber größer in der gradlexikographischen Ordnung.

    Wir betrachten das Polynom

    Dabei treten rechts die elementarsymmetrischen Polynome mit nichtnegativen Exponenten auf. Das Polynom rechts enthält ebenfalls als Leitmonom: Hierzu muss man sich die Monome in klar machen. Das Leitmonom von ist und das Leitmonom von ist (das Leitmonom ist multiplikativ, siehe Aufgabe 1.10). Daher hat das Polynom rechts das Leitmonom

    In der Differenz verschwindet also dieses Monom, d.h. hat einen kleineren Grad in der gradlexikographischen Ordung. Da ebenfalls symmetrisch ist, liefert die Induktionsvoraussetzung die Behauptung.
    Zur Eindeutigkeit. Wir zeigen, dass die elementarsymmetrischen Polynome algebraisch unabhängig sind. Es sei also

    wobei ein Polynom in den Variablen sei. Wir schreiben als Summe von Monomen der Form

    mit . Es sei dasjenige Tupel mit

    das in der gradlexikographischen Ordnung maximal ist unter allen Tupeln, für die in vorkommt (es werden also die verglichen, nicht die Differenzen). Dann besitzt als Polynom in das Leitmonom und wäre nicht .


    Insbesondere ist der Ring der symmetrischen Polynome selbst isomorph zu einem Polynomring in Variablen.



    Fußnoten
    1. Wenn man die durch eine Permutation induzierte lineare Abbildung

      betrachtet, so ist es natürlicher, die -te Variable , die ja die -te Projektion von auf bezeichnet, auf , also auf , abzubilden.


    Kurs:Invariantentheorie (Osnabrück 2012-2013) | >>

    PDF-Version dieser Vorlesung

    Arbeitsblatt zur Vorlesung (PDF)