Matrix/Stochastisch/Einführung/Textabschnitt
Die zugrunde liegende Interpretation für eine spaltenstochastische Matrix ist folgendermaßen: Man hat eine Menge von möglichen Plätzen, Positionen, Netzwerkknoten, Internetseiten oder ähnliches, in denen man sich mit einer gewissen Wahrscheinlichkeit (einer Verteilung, einer Gewichtung) aufhalten kann. Eine solche Verteilung wird durch ein -Tupel mit reellen nichtnegativen Zahlen mit beschrieben. Man spricht von einem Verteilungsvektor. Eine spaltenstochastische Matrix beschreibt die Übergangswahrscheinlichkeiten des gegebenen Netzwerks in einem bestimmten Zeitabschnitt. Der Eintrag ist die Wahrscheinlichkeit, dass ein im Knoten befindliches Objekt (ein Besucher der Netzseite ) zur Position hinüberwechselt (sich zur Netzseite weiterklickt). Der -te Standardvektor entspricht der Verteilung, in der alles im -ten Knotenpunkt konzentriert ist. Die -te Spalte der Matrix beschreibt das Bild dieses Standardvektors unter der Matrix. Generell wird zu einer Verteilung durch Anwenden der Matrix die Bildverteilung ausgerechnet, siehe Aufgabe. Naheliegende Fragen sind, ob es Verteilungen gibt, die stationär sind (stationäre Verteilung oder Fixverteilung oder Eigenverteilung), also in sich selbst überführt werden, ob es periodische Verteilungen gibt, ob es bei „unendlich vielen“ Iterationen der Matrix Grenzverteilungen gibt, und wie man diese ausrechnen kann.
Eine reelle quadratische Matrix
heißt spaltenstochastisch, wenn alle Einträge
sind und für jede Spaltensumme (also jedes )
gilt.
Eine spaltenstochastische -Matrix hat die Form
mit
Das charakteristische Polynom ist
Eigenwerte sind also und . Eine stationäre Verteilung ist (der Fall und ist für die folgende Rechnung auszuschließen) durch gegeben, es ist ja
Die spaltenstochastische -Matrix
führt die Verteilung in die Verteilung über. Die Verteilung wird in sich selbst überführt, ist also eine stationäre Verteilung. Die Verteilung wird in überführt und umgekehrt, es handelt sich also um periodische Verteilungen der Periodenlänge .
Die spaltenstochastische -Matrix
führt die Verteilung in die Verteilung
über. Der erste Standardvektor ist ein Eigenvektor zum Eigenwert , die weiteren Standardvektoren werden, wie jeder Verteilungsvektor, in den ersten Standardvektor überführt. Der Kern wird von den Vektoren , , erzeugt und enthält keine Verteilungsvektoren.
Es sei ein Netzwerk (oder ein „gerichteter Graph“), bestehend aus einer Menge aus Knotenpunkten und einer Menge an gerichteten Verbindungen, die zwischen Knotenpunkten bestehen können. Beispielsweise ist die Menge aller Seiten im Internet und von der Seite besteht ein Verbindungspfeil nach , falls es auf der Internetseite einen Link auf die Seite gibt. Die Verlinkungsstruktur kann man durch die Adjazenzmatrix
ausdrücken, wobei
festgelegt ist (in der -ten Spalte sind die von ausgehenden Links ablesbar), oder aber durch die spaltenstochastische Matrix
wobei
und die Anzahl der Links angibt, die vom -ten Knoten überhaupt ausgehen. Diese Division sichert, dass die Spaltensummennorm gleich wird (es sei vorausgesetzt, dass von jedem Knoten mindestens ein Link ausgeht).
Die Adjazenzmatrix und die spaltenstochastisch gemachte Adjazenzmatrix zum Graphen rechts (wobei wir durchgängig Selbstlinks hinzunehmen) sind