Interpolationsproblem

Bearbeiten

Das Problem der Interpolation besteht allgemein darin, für gegebene Stützpunkte bzw. Daten ein Funktion eines gegebenen endlich-dimensionalen Funktionenraums zu bestimmen, so dass

gilt. Dabei können die von einer gegebenen, in den definierten Funktion herrühren, d. h. kann

gelten.

Zielsetzung

Bearbeiten

Ähnlich wie bei der Ausgleichsrechnung geht es also darum, eine große Zahl von Daten durch eine Funktion zu ersetzen bzw. eine Funktion , die möglicherweise durch eine komplizierte und numerisch aufwendig auszuwertende Vorschrift definiert ist, durch eine Funktion mit einer einfacheren Vorschrift anzunähern, die ebenfalls die Daten interpoliert.

Unterschied zur Ausgleichsrechnung

Bearbeiten

Bei bei der Interpolation wird im Unterschied zur Ausgleichsrechnung gefordert, dass der Graph der gesuchten Funktion genau durch die Punkte verläuft und nicht nur mit einem möglichst geringen Fehler annähert.

Beispiel - Lineare Regression

Bearbeiten

Bei der linearen Regression versucht man eine Ausgleichsgerade zu finden, dessen Abstand zu den Daten minimiert. Das aus den Daten entstehende Gleichungssystem ist überbestimmt und daher im Allgemeinen nicht eindeutig lösbar. Eine Interpolation von mehr als zwei Datenpunkten mit einem Polynom 1. Grades ist daher im Allgemeinen nicht möglich.

Ansatzraumes

Bearbeiten

Für die Wahl des Ansatzraumes gibt es nun wie bei der Ausgleichsrechnung oder anderen Arten der Approximation viele Möglichkeiten. Hier wollen wir nur auf die wichtigste Art der Interpolation eingehen, die Polynominterpolation, bei der

der Funktionenraum aller Polynome vom Höchstgrad , also mit ist.

Polynominterpolation

Bearbeiten

Wir betrachten also jetzt das folgende Problem (IP) der Interpolation durch ein Polynom:

(IP) Für gegebene Stützpunkte
(6.1)
mit Stützstellen
(6.2)
bestimme ein Interpolationspolynom mit
(6.3)

Die Bedingung (6.2) könnte man an einigen Stellen in diesem Kapitel fortlassen. Sie ist aber sinnvoll und wird insbesondere zum Beweis der Eindeutigkeit des Interpolationspolynoms im nächsten Satz benötigt.

Satz - Eindeutigkeitssatz - Interpolationsproblem

Bearbeiten
Das Interpolationsproblem (IP) hat eine eindeutige Lösung .

Sei in der Form

gegeben. Dann lauten die Gleichungen (6.3)

(6.4)

Dies sind Gleichungen in den Unbekannten . Die zu diesen Gleichungen gehörende Systemmatrix ist die bereits aus Abschnitt 4.2 bekannte Vandermonde-Matrix

Ihre Determinante, die Vandermonde-Determinante, ist durch

gegeben (siehe R. Zurmühl: Matrizen und ihre technischen Anwendungen, Springer, Berlin, 1965). Wegen (6.2) ist und alles gezeigt.

q.e.d.

Der Beweis des letzten Satzes macht deutlich, dass man das Interpolationspolynom bestimmen kann, indem man das System (6.4) löst. Leider ist die zugehörige Systemmatrix, die Vandermonde-Matrix, sehr schlecht konditioniert, wie wir bereits in Abschnitt 4.2 festgestellt hatten. Daher ist von diesem Weg zur Lösung des Interpolationsproblems abzuraten. Wir geben im Folgenden andere Möglichkeiten der Bestimmung an, die aber alle auch Vor- und Nachteile haben.

6.2 Die Lagrangesche Darstellung des Interpolationspolynoms

Bearbeiten

Wir führen zunächst spezielle Polynome ein:

Definition 6.2

Bearbeiten
Zu   Stützstellen     mit   für   sind die Langrangeschen Basispolynome     definiert durch
 

Offenbar hat das Lagrangesche Basispolynom   die   Nullstellen     und genügt es den   Bedingungen

(6.5)  

Da   ein Polynom vom Höchstgrad   ist und somit, wenn es nicht das Nullpolynom ist, maximal   Nullstellen hat, folgt:

(6.6)  

Das heißt, die   sind linear unabhängig und es ist somit

 

Wegen

 

folgt damit

 

Die Funktionen   bilden also eine Basis des Polynomraumes  , so dass sich jedes Polynom vom Höchstgrad   und damit auch das eindeutig bestimmte Interpolationspolynom als Linearkombination der   darstellen lässt. Für die nach Satz 6.1 eindeutige Lösung   des Interpolationsproblems (IP) ist diese Darstellung wegen (6.5) besonders einfach. Denn macht man für   den Ansatz

 

so folgt mit (6.3) und (6.5)

 

und damit die Lagrangesche Darstellung des Interpolationspolynoms

(6.7)  

Sie hat den Vorteil, dass man an ihr die Stützwerte   für die Stützpunkte   und damit die Interpolationsbedingungen (6.3) sofort ablesen kann.

Beispiel 6.3

Bearbeiten

Zu den Stützpunkten

 

lauten die Langrangeschen Basispolynome

 
 
 

Das Interpolationspolynom   zu diesen Stützpunkten ist somit gegeben durch

 

Zum Beispiel für   berechnet man

 

Man beachte, dass die Abbildung

 

die für vorgegebene, paarweise verschiedene   jeder Menge von   Stützwerten   das eindeutige Interpolationspolynom zuordnet, linear ist.

Leider ist aber auch die Lagrangesche Darstellung des Interpolationspolynoms für praktische Rechnungen mit großem   weniger geeignet. Denn die Berechnung von   in einem Punkt   für ein   verlangt insgesamt   Produkte und 1 Division, so dass für die Auswertung des Interpolationspolynoms an einer Stelle   insgesamt  , also   wesentliche arithmetische Operationen benötigt werden. Außerdem erfordert die Lagrangesche Darstellung des Interpolationspolynomes im Fall der Hinzunahme eines Stützpunktes oder mehrerer Stützpunkte zu der ursprünglichen Stützpunktmenge die Neuberechnung aller   und damit des gesamten Interpolationspolynoms.

6.3 Das Neville-Schema

Bearbeiten

Die Lösung für das Problem (IP), d. h. das Interpolationspolynom, kann auch schrittweise aus den Interpolationspolynomen für   Stützpunkte berechnet werden. Um dies zu zeigen, benötigen wir:

Definition 6.4

Bearbeiten
Zu   Stützpunkten   wie in (6.1) und (6.2) bezeichne   das (eindeutig bestimmte) Polynom vom Grad   mit
(6.8)  
wobei   und   seien.

Damit können wir die Lösung   des Problems (IP) auch in der Form

 

schreiben. Weiter können wir in diesem Zusammenhang beweisen:

Satz 6.5

Bearbeiten
Für   gilt die Rekursionsformel
(6.9)  
(6.10)  , falls  .

Die Identität (6.9) ist wegen   und   richtig. Nun bezeichne   die rechte Seite von (6.10), so dass   zu zeigen ist.

Es gilt   und   und demnach  . Weiter gilt

 

und für   hat man

 

Wegen der Eindeutigkeit des Interpolationspolynoms (vgl. Satz 6.1) folgt  .

q.e.d.

Die Formel (6.10) ist eine Rekursionsformel, die es ermöglicht, das Polynom   vom Grad   aus den beiden Polynomen   und   vom Grad   zu bestimmen. Sie führt auf das Neville-Schema, bei dem sich die Einträge spaltenweise berechnen lassen:

 

Mit diesem Schema lässt sich das Interpolationspolynom   an einzelnen Stellen   auswerten. Dazu werden jeweils

 

Multiplikationen und Divisionen benötigt.

Beispiel 6.6

Bearbeiten

Wir betrachten wieder die Stützpunkte aus Beispiel 6.3:

 

Für   berechnet man

 
 
 

Demnach sieht das Neville-Schema hier wie folgt aus:

 

Bei Aufnahme eines neuen Stützpunktes oder mehrerer neuer Stützpunkte und Auswertung des Interpolationspolynoms an derselben Stelle wie zuvor, muss das Neville-Schema, anders als es eine Auswertung über die Lagrangesche Darstellung erfordern würde, nicht vollständig neu aufgestellt werden, sondern müssen nur entsprechende Zeilen am Ende des Schemas hinzugefügt werden. Falls ein Interpolationspolynom jedoch an mehreren Stellen zu bestimmen ist, sind trotzdem andere Methoden vorzuziehen. Eine davon wird im folgenden Abschnitt vorgestellt.

6.4 Die Newtonsche Darstellung des Interpolationspolynoms

Bearbeiten

Wir definieren zunächst:

Definition 6.7

Bearbeiten
Zu gegebenen   Stützstellen     sind die Newtonschen Basispolynome     definiert durch
 

Man beachte dabei, dass das leere Produkt als 1 definiert, also   ist. Ähnlich wie für die Lagrangeschen Basispolynome in (6.6) schließt man, dass die Newtonschen Basispolynome linear unabhängig sind und

 

ist. Jedes Polynom vom Höchstgrad   lässt sich also auch nach Newtonschen Basispolynomen entwickeln. Insbesondere soll nun eine solche Entwicklung

(6.11)  

d. h., sollen nun zugehörige Koeffizienten   für das Interpolationspolynom   bestimmt werden.

Die Koeffizienten   in (6.11) lassen sich nacheinander aus den Gleichungen

 
 
 
 

gewinnen. Zur Berechnung der Koeffizienten des Interpolationspolynoms wären bei dieser Vorgehensweise

 

Multiplikationen und Divisionen und insgesamt   arithmetische Operationen erforderlich. Eine Vorgehensweise, die dafür nur   Divisionen und nur insgesamt   arithmetische Operationen verlangt, soll im Folgenden vorgestellt werden.

Definition 6.8

Bearbeiten
Für   Stützpunkte   wie in (6.1) und (6.2) heißen die Zahlen
 
(6.12)  
dividierte Differenzen, wobei   und   seien.

Man beachte, dass die dividierte Differenz   von den Stützstellen   und den Stützwerten   abhängt. Die genauen Abhängigkeiten zwischen den einzelnen dividierten Differenzen können dem folgenden Tableau entnommen werden.

 

Zum Beispiel gilt

 

Zur Berechnung aller dividierten Differenzen für   Stützpunkte werden insgesamt nur

 

Divisionen benötigt. Ferner gilt folgender Satz:

Satz 6.9

Bearbeiten
Für die Lösung   des Interpolationsproblems (IP) hat man die Darstellung (6.11) mit
(6.13)  

Der Beweis wird per vollständiger Induktion über   geführt. Die Behauptung ist sicher für   richtig. Es sei nun angenommen, dass sie für beliebiges   und beliebige Stützpunkte   mit   für   richtig sei.

Seien nun   Stützpunkte   mit   für   gegeben und   das zugehörige Interpolationspolynom. Mit den in Definition 6.4 definierten Polynomen gilt dann

 

und daher mit einer Konstanten   (  ist möglich)

 

bzw.

(6.14)  

Nach Induktionsvoraussetzung gilt nun   so dass noch

 

zu zeigen bleibt.

Nach Satz 6.5 gilt

(6.15)  

so dass die Behauptung per Koeffizientenvergleich folgt: wegen (6.14) muss a der Hauptkoeffizient von  , d. h. muss

 

für ein gewisses Polynom   sein. Weiter ist nach Induktionsvoraussetzung bekannt, dass   und   die Hauptkoeffizienten   und   haben und damit   den folgenden Hauptkoeffizienten hat:

 

Somit ist alles gezeigt.

q.e.d.

Die Darstellung (6.13) nennt man die Newtonsche Darstellung des Interpolationspolynoms. Nimmt man einen weiteren Stützpunkt zu den ursprünglich   Stützpunkten zusätzlich mit auf, so ändern sich offenbar die ersten   Koeffizienten des Interpolationspolynoms in dieser Darstellung nicht und kann man den Koeffizienten   berechnen, indem man im Schema der dividierten Differenzen unten eine zusätzliche Zeile für diesen Punkt berechnet.

Sind schließlich die Koeffizienten   der Newtonschen Darstellung (6.11) des Interpolationspolynoms   bekannt, so kann dieses für jedes   effizient mit dem Horner-Schema

 

ausgewertet werden, wobei die Operationen von links nach rechts auszuführen sind.

Zum Abschluss zeigen wir die Vorgehensweise wieder an unserem Standardbeispiel.

Beispiel 6.10

Bearbeiten

Gegeben seien die Stützpunkte

 

Dazu stellen wir das Schema der dividierten Differenzen auf:

 

Das Interpolationspolynom   zu diesen Stützpunkten lautet somit in der Newtonschen Darstellung:

(6.16)  

Nimmt man beispielsweise den Punkt   mit hinzu, so muss man nur das obige Schema um eine Zeile erweitern:

 

Das Interpolationspolynom   zu diesen Stützpunkten ist dann in Bezug auf (6.16) nur um einen Term zu erweitern:

 

Das Horner-Schema zur Berechnung von letzterem Polynom an der Stelle   lässt sich mit

 

wie folgt darstellen, wobei hier   ist:

 

Offenbar ist  .

6.5 Der Fehler bei der Polynominterpolation

Bearbeiten

Der folgende Satz gibt für hinreichend oft differenzierbare Funktionen eine Darstellung des bei der Polynominterpolation auftretenden Fehlers an.

Satz 6.11

Bearbeiten
Es seien   und  . Für jedes   genügt dann die Lösung   des Interpolationsproblems (IP) der Gleichung
(6.17)  
mit
(6.18)  
und einem  .

Da für   für   nichts zu zeigen ist, nehmen wir   für   an. Sei nun

 

mit

 

so dass   folgt. Also besitzt   in dem Intervall   mindestens   paarweise verschiedene Nullstellen

 

Wiederholte Anwendung des Satzes von Rolle zeigt, dass   in dem Intervall   mindestens   Nullstellen besitzt,   mindestens   usw. und somit   mindestens noch eine Nullstelle  . Nun gilt aber

 

wobei die zweite Identität aus der Tatsache folgt, dass   den Hauptkoeffizienten 1 hat. Insgesamt erhält man damit

 

was den Beweis vervollständigt.

q.e.d.

Eine weitere Darstellung für den bei der Polynominterpolation entstehenden Fehler erhält man mittels dividierter Differenzen.

Satz 6.12

Bearbeiten
Es seien   und  . Für jedes   genügt dann die Lösung   des Interpolationsproblems (IP) der Gleichung
 

Mit   für   hat man nach Satz 6.9

 

für alle  , so dass mit der Identität   die Behauptung folgt.

q.e.d.

Als Konsequenz aus den Sätzen 6.11 und 6.12 ergibt sich für die dividierten Differenzen:

Korollar 6.13

Bearbeiten

Es seien   und   Stützwerte zu Stützstellen   mit   für  . Dann existiert ein   mit

 

Für   ist die Behauptung trivial und für   folgt sie unmittelbar aus einem Vergleich der rechten Seiten in den Sätzen 6.11 und 6.12, wenn diese auf   und   angewandt werden.

q.e.d.

Wir wollen nun der Frage nachgehen, ob die Wahl von mehr Stützstellen automatisch auch zu einer Verringerung des bezüglich   maximalen Interpolationsfehlers führt oder, anders ausgedrückt, ob der maximale Interpolationsfehler für eine Folge von Interpolationspolynomen zu zunehmend wachsender Zahl von Stützstellen gegen Null strebt. Dazu sei für jedes   für den Rest des Unterabschnitts

(6.19)  

mit einem   eine Partition von   und

 

ein Maß für die Feinheit der Unterteilung. Weiter sei   das Interpolationspolynom zu   mit den Stützstellen  . Aus Satz 6.11 können wir dann zunächst das folgende Konvergenzergebnis schließen. Man beachte, dass dafür nicht     gefordert ist.

Satz 6.14

Bearbeiten
Es sei   und es gelte mit einem  
 
Weiter sei   eine Folge von Partitionen von   der Form (6.19) mit    . Dann konvergiert die Folge der zugehörigen Interpolationspolynome auf   gleichmäßig gegen  , d. h., es gilt
 

Aus Satz 6.11 schließt man

 

Für     konvergiert der letzte Term für   gegen Null, so dass alles gezeigt ist.

q.e.d.

Beispiel 6.15

Bearbeiten

Für   hat man

 

und somit z. B. für  

 

Allgemein kann man jedoch nicht erwarten, dass eine gegebene Funktion auf einem kompakten Intervall umso besser durch ein Interpolationspolynom approximiert wird, je feiner die Unterteilung der Stützstellen gewählt wird. Wie man zeigen kann, ist dafür die Funktion

 

ein Beispiel. Für deren Ableitungen in   man

 

zeigen kann, so dass z. B. für   mit einer Konstanten   folgt:

 

In diesem Fall ist also auch die Voraussetzung von Satz 6.14 nicht erfüllt. Allgemein hat man in diesem Zusammenhang das folgende „Negativergebnis“, den Satz von Faber, welcher insbesondere für Folgen von Partitionen   mit     von Interesse ist. (Einen Beweis, der allerdings einiges voraussetzt, findet man bei E. W. Cheney: Introduction to Approximation Theory, 2nd edition, Chelsea, New York, 1982.)

Satz 6.16 (Faber)

Bearbeiten
Zu jeder Folge von Partitionen   von   der Form (6.19) existiert eine Funktion  , so dass für die Folge der zugehörigen Interpolationspolynome auf   gilt:
 

6.6 Tschebyscheff-Polynome

Bearbeiten

Der Fehler des Interpolationspolynoms zu   vorgegebenen Stützstellen wird durch (6.17) beschrieben. Da der Punkt   in (6.17) i. a. unbekannt ist, macht es Sinn, statt der Darstellung (6.17) des Interpolationsfehlers die Abschätzung

(6.20)  

zu betrachten. In diesem Abschnitt wird der Frage nachgegangen, für welche Stützstellen   der darin stehende Ausdruck

 

am kleinsten wird, d. h. es soll das Minimax-Problem

 

gelöst werden. Da jedes Polynom vom Grad   mit Hauptkoeffizientem 1 mit Hilfe seiner Nullstellen   als Produkt   geschrieben werden kann, ist also ein Polynom gesucht, welches unter allen Polynomen vom Grad   mit Hauptkoeffizienten 1 die Maximumnorm bezüglich   minimal macht. Wählt man die   Nullstellen eines solchen Polynoms als Stützstellen, so erzeugt also das zugehörige Interpolationspolynom   unter allen Interpolationspolynomen zu   Stützpunkten   die kleinste obere Fehlerschranke in (6.20).

Wir betrachten zunächst nur das Intervall  . Es wird sich im Folgenden herausstellen, dass die gesuchten „optimalen“ Stützstellen   gerade die Nullstellen des  -ten Tschebyscheff-Polynoms erster Art sind.

Definition 6.17

Bearbeiten
Die Funktionen
(6.21)  
heißen Tschebyscheff-Polynome erster Art.

Im folgenden Satz sind einige Eigenschaften dieser Funktionen aufgeführt.

Satz 6.18

Bearbeiten
Für   wie in (6.21) gelten die folgenden Aussagen:
(i)  
(ii) Für   gilt   und
(6.22)  
und Fortsetzung des Definitionsbereichs der so definierten   auf ganz   liefert
(6.23)  
(iii)   hat für   den Hauptkoeffizienten  .
(iv) Es gilt
 
(v)   besitzt die   einfachen Nullstellen
(6.24)  
welche alle in dem Intervall   liegen.
(vi)   besitzt in dem Intervall   insgesamt   Extremwerte
 
für
(6.25)  

(i) gilt offensichtlich und die Darstellungen für   und   in (ii) ergeben sich sofort aus der Definition (6.21). Für die Herleitung der Rekursionsformel (6.22) benötigen wir die Formel

 

Mit (i) liefert diese für   und  

 

Weiter folgt (iii) aus der Rekursionsformel (ii) und folgt (iv) mit (i) wegen

 

Schließlich sind die Aussagen (v) und (vi) offensichtlich richtig.

q.e.d.

Nach Satz 6.18 (iii) und (v) gilt mit den Nullstellen   von   wie in (6.24) die Darstellung

(6.26)  

Der folgende Satz besagt nun, dass dieses Polynom unter allen Polynomen vom Grad   mit Hauptkoeffizienten 1 die Maximumnorm auf   minimal macht und dass man überdies den zugehörigen Wert dieser Norm auch angeben kann.

Satz 6.19

Bearbeiten

Für   und die   wie in (6.24) gilt die folgende Optimalitätseigenschaft:

(6.27)  

Die zweite Identität folgt aus (6.26) mit Satz 6.18 (iv). Weiter ist bei der ersten Identität in (6.27) die Abschätzung „ “ offensichtlich. Die Abschätzung „ “ soll nun durch eine Widerspruchsannahme nachgewiesen werden.

Angenommen, es gibt Zahlen   mit

(6.28)  

für  . Also ist insbesondere

(6.29)  

Für das Polynom

 

schließt man mit (6.25) und (6.29)

 

Also hat   mindestens   Vorzeichenwechsel in   und gilt allgemein

 

Das Polynom   besitzt demnach   einfache paarweise verschiedene Nullstellen in  . Nun ist sowohl   als auch   ein Polynom vom Grad   und besitzen beide Funktionen den führenden Koeffizienten 1, so dass notwendigerweise   gilt. Da   im Fall   nur höchstens   paarweise verschiedene Nullstellen haben kann, folgt   bzw.

 

was aber wegen Satz 6.18 (iv) und (6.29) der Annahme (6.28) widerspricht.

q.e.d.

Damit haben wir den Fall   behandelt. Abschließend werden wir nun noch allgemeine Intervalle   betrachten. Dazu verwenden wir die affin-lineare Transformation

(6.30)  

mit welcher der nachfolgende Satz leicht aus Satz 6.19 zu schließen ist.

Satz 6.20

Bearbeiten
Mit der Funktion   aus (6.30) und den   wie in (6.24) gilt die Optimalitätseigenschaft
 
(6.31)  
(6.32)  

Die Identität (6.32) ergibt sich mit Satz 6.19 unter Verwendung von (6.30) aus

 
 
 
 

Weiter ist in (6.31) sicher die Ungleichung „ “ richtig. Zum Beweis der Ungleichung „ “ seien nun   beliebig. Dann gibt es eindeutig bestimmte Zahlen   mit   für   und mit diesen erhält man ähnlich wie im ersten Teil des Beweises

 
 

q.e.d.

Korollar 6.21

Bearbeiten
Sei   und   das Interpolationspolynom zu den Stützpunkten   mit   für   aus (6.30) und   wie in (6.24). Dann gilt für den Interpolationsfehler
(6.33)  

Man beachte aber, dass nach dem Satz von Faber 6.16 auch bei Wahl der Tschebyscheff-Knoten die Interpolationspolynome mit wachsendem   nicht gleichmäßig auf   gegen   konvergieren müssen.

Beispiel 6.22

Bearbeiten

Gegeben sei die Funktion  , welche im Intervall   in 5 Punkten durch ein Interpolationspolynom möglichst kleinen Grades so interpoliert werden soll, dass die maximale Schranke für den Approximationsfehler möglichst klein ausfällt. Die Stützstellen sind dann gemäß Korollar 6.21 zu wählen. Da der erste Punkt den Index 0 hat, ist hier  . Mit

 

und (6.24) lauten die gesuchten Stützstellen

 

Demnach errechnet man mit  

 

Man hat weiter für  

 

und damit

 

Für das Interpolationspolynom   zu den berechneten Stützpunkten kann man also gemäß (6.33) die folgende maximale Abweichung von   auf   vorhersagen:

 

Abschließend sei noch gesagt, dass ein Nachteil der in diesem gesamten Kapitel dargestellten Form der Interpolation ihrer großen Fehlerempfindlichkeit ist. Fehlerhafte Daten   wirken sich nicht nur lokal bei der Stützstelle   aus, sondern verändern den Verlauf über das ganze Intervall hinweg relativ stark. Dies wird an dem folgenden einfachen Beispiel deutlich.

Beispiel 6.23

Bearbeiten

Seien

 
 

Dann hat man   und somit

 

Darstellung des Interpolationspolynoms   und damit des auf   bezogenen Interpolationsfehlers für z. B.   zeigt, dass   durch „Messfehler“   und   an der Stelle   sehr unterschiedlich verändert wird und zwar keineswegs nur an der Stelle  .

Sieha auch

Bearbeiten

Seiteninformation

Bearbeiten

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Bearbeiten

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Numerik I' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.