Kurs:Numerik I/Konvergenzraten

Einleitung - Konvergenzraten

Bearbeiten

Die Verfahren, die wir bisher im Zusammenhang mit der Lösung linearer Gleichungssysteme und Ausgleichsprobleme vorgestellt haben, bestimmen in endlich vielen Schritten eine Lösung, welche, wenn man exakt rechnen könnte, immer die exakte Lösung des Problems wäre. In der Praxis lassen sich aber viele mathematische Probleme nur mittels eines Iterationsverfahrens näherungsweise lösen.

Iterationsverfahren

Bearbeiten

d. h. mittels wiederholter Anwendung derselben Rechenvorschriften, wobei in der  -ten Iteration („Wiederholung“), ausgehend von einer Näherung  , eine neue und möglichst genauere Näherung   für eine gesuchte Lösung des Problems berechnet wird. Für den Start eines solchen Verfahrens muss man folglich eine Startnäherung   vorgeben.

Iterationsverfahren würden im allgemeinen, wenn sie nicht nach endlich vielen Schritten abgebrochen würden, eine unendliche Folge   von Iterierten generieren. Aufgabe des Numerikers ist es zu zeigen, dass jede konvergente Teilfolge oder die ganze vom Verfahren erzeugte Folge   für jeden Startpunkt aus einer gewissen Menge gegen eine (ja a priori unbekannte!) Lösung   des gegebenen Problems konvergiert. In diesem Zusammenhang spricht man von globaler Konvergenz eines Verfahrens, wenn diese Konvergenz für jede Wahl des Startpunktes aus einer wohlbestimmten Menge (z. B. dem ganzen  ) gegeben ist, und von lokaler Konvergenz, wenn dies nur für Startpunkte aus einer (im Allgemeinen nicht spezifizierbaren) Umgebung einer Lösung der Fall ist. In der Praxis wird ein Iterationsverfahren natürlich nach einer endlichen Anzahl von Iterationen gestoppt und zwar dann, wenn zum ersten Mal ein Abbruchkriterium erfüllt ist, welches ausreichende Genauigkeit der aktuellen Näherung im Hinblick auf eine Lösung des Problems sicherstellt. Die Angabe eines sinnvollen Abbruchkriteriums kann dabei durchaus ein schwieriges Unterfangen sein.

Für ein gegebenes Verfahren ist neben dem rechnerischen Aufwand, der pro Iteration zu leisten ist, naturgemäß von Interesse, wie schnell es, wenn es nicht abgebrochen würde, gegen eine gesuchte Lösung konvergieren würde und damit, ob im Schnitt nur wenige oder viele Iterationen durchlaufen werden müssen, bis ein gegebenes Abbruchkriterium erfüllt ist. Wir wollen daher als nächstes den Begriff der Konvergenzgeschwindigkeit eines Verfahrens genauer fassen.

Definition 5.1

Bearbeiten
Sei   eine Norm auf dem   und   eine Folge in   mit  .
(i) Die Folge   konvergiert von (mindestens) der Ordnung   (gegen  ), wenn mit einem   und einem  
(5.1)  
gilt, wobei   für   sei. Im Fall   spricht man auch von linearer und im Fall   von quadratischer Konvergenz.
(ii) Die Folge   konvergiert superlinear (gegen  ), wenn   für ein   gilt sowie
(5.2)  

Die drei wichtigsten Konvergenzraten bei Algorithmen sind lineare, superlineare und quadratische Konvergenz, so dass wir uns im Folgenden nur auf sie beziehen werden.

Die (praktisch irrelevante) Voraussetzung „  für ein  “ bei der Definition der superlinearen Konvergenz kann man vermeiden, indem man diese mit einer Folge   von Zahlen   mit   durch

(5.3)  

für ein   definiert. Für   kann man superlineare Konvergenz der Folge   auch durch die Beziehung

 

ausdrücken und quadratische Konvergenz durch

 

Beispiel 5.2

Bearbeiten

Die Folgen   und   mit

 

konvergieren für   gegen  . Man errechnet

 
 
 

Also konvergiert   linear,   superlinear und   quadratisch gegen 1. Die folgende Tabelle demonstriert, was die unterschiedlichen Konvergenzraten praktisch bedeuten.

 

Quadratische Konvergenz impliziert superlineare Konvergenz und diese wiederum lineare Konvergenz. Denn im Fall quadratischer Konvergenz hat man mit einem   und einem  

 

was wegen   die Bedingung (5.3) impliziert. Ist andererseits (5.2) gegeben, dann existiert zu jedem   ein  , so dass gilt:

(5.4)  

Letztere Beziehung drückt gerade die lineare Konvergenz aus.

Im Fall der superlinearen Konvergenz gilt ja (5.4), d. h. lineare Konvergenz mit einem  , so dass man bei der Definition der linearen und superlinearen Konvergenz auf die Voraussetzung   verzichten könnte. Denn die Ungleichung (5.1) impliziert im Fall der linearen Konvergenz

 

und damit wegen   auch die Konvergenz  . Bei der Definition einer Konvergenzordnung   muss man aber, da dort nicht   gefordert ist, die Konvergenz der Folge   explizit voraussetzen.

Man beachte, dass lineare Konvergenz mit einer Konstanten   sehr langsame Konvergenz bedeuten kann.

Beispiel 5.3

Bearbeiten

Für die gegen 1 konvergierende Folge   mit   gilt

 

Die langsame Konvergenz sei mit der Berechnung einiger Folgenglieder gezeigt:

 

Man hofft also, dass die Konstante   in der Praxis im Fall der linearen Konvergenz   ist und im Fall der quadratischen Konvergenz nicht allzu groß wird. In letzterem Fall besagt die Ungleichung (5.1) für  , dass sich für einen Fehler   die Anzahl der korrekten Stellen hinter dem Dezimalpunkt von   bezüglich   gegenüber der von   ungefähr verdoppelt. Denn dann ist

 

so dass man bei einer Genauigkeit von   Stellen hinter dem Dezimalpunkt für   bezüglich der Norm   im  -ten Schritt einen Fehler   hat und somit im  -ten Schritt einen Fehler

 

Quadratische Konvergenz ist demnach eine für die Praxis sehr gute Eigenschaft eines Verfahrens und meist die schnellste Konvergenz, die man mit vernünftigen Mitteln erreichen kann.

Es sei jedoch darauf hingewiesen, dass eine gute Konvergenzrate eines Verfahrens alleine nicht dessen Effizienz garantiert. Von einem gegebenen Verfahren ausgehend, kann man ja immer ein noch schnelleres Verfahren erzeugen, indem man mehrere Iterationen des ersten Verfahrens zu einer einzigen zusammenfasst. Neben der Konvergenzgeschwindigkeit eines Verfahrens hat man also bei der Beurteilung eines Verfahrens den numerischen Aufwand pro Iteration und natürlich auch seine Stabilität zu berücksichtigen.

Wir bemerken ferner, dass die Eigenschaften der superlinearen und quadratischen Konvergenz einer Folge   gegen einen Punkt   im   aufgrund der Äquivalenz aller Normen im   unabhängig von der gewählten Norm sind. Denn die Äquivalenz zweier Normen   und   auf dem   besagt, dass mit zwei Konstanten   und  

 

gilt, so dass z. B. die Beziehung in (5.3) bezogen auf die Norm  

 

impliziert und damit für die Nullfolge   mit   auch

 

Ähnlich garantiert quadratische Konvergenz bezüglich der Norm   auch die quadratische Konvergenz

 

bezüglich einer Norm  , wobei die Konstante   von der Norm   abhängt. Dagegen muss lineare Konvergenz einer Folge im   bezüglich einer Norm nicht notwendig die lineare Konvergenz hinsichtlich einer anderen Norm auf dem   zur Folge haben. Zwar gilt beispielsweise für jede linear bezüglich   konvergente Folge   auch

 

mit einer Konstanten   für eine Norm  , jedoch nicht notwendig  . Sprechen wir also von linearer Konvergenz, so müssen wir klarstellen, bezüglich welcher Norm wir dies tun. Wenn nichts Anderes gesagt wird, beziehen wir uns immer auf Konvergenz im Sinne der Euklidischen Norm  .

Die hier eingeführten Begriffe der linearen, superlinearen und quadratischen Konvergenz werden gelegentlich auch als  -lineare,  -superlineare bzw.  -quadratische Konvergenz bezeichnet, im Unterschied zur  -linearen,  -superlinearen bzw.  -quadratischen Konvergenz (siehe z. B. das Buch von Ortega und Rheinboldt aus dem Jahre 1970). Das „ “ steht dabei für „Quotient“, da die Konvergenzrate in allen Fällen mittels des Quotienten   ausgedrückt werden kann (während „ “ für engl. „Root“, also „Wurzel“ steht).

Siehe auch

Bearbeiten

Seiteninformation

Bearbeiten

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Bearbeiten

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Numerik I' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.