Das Problem der Interpolation besteht allgemein darin, für gegebene Stützpunkte bzw. Daten ein Funktion eines gegebenen endlich-dimensionalen Funktionenraums zu bestimmen, so dass
gilt. Dabei können die von einer gegebenen, in den definierten Funktion herrühren, d. h. kann
Ähnlich wie bei der Ausgleichsrechnung geht es also darum, eine große Zahl von Daten durch eine Funktion zu ersetzen bzw. eine Funktion , die möglicherweise durch eine komplizierte und numerisch aufwendig auszuwertende Vorschrift definiert ist, durch eine Funktion mit einer einfacheren Vorschrift anzunähern, die ebenfalls die Daten interpoliert.
Bei bei der Interpolation wird im Unterschied zur Ausgleichsrechnung gefordert, dass der Graph der gesuchten Funktion genau durch die Punkte verläuft und nicht nur mit einem möglichst geringen Fehler annähert.
Bei der linearen Regression versucht man eine Ausgleichsgerade zu finden, dessen Abstand zu den Daten minimiert.
Das aus den Daten entstehende Gleichungssystem ist überbestimmt und daher im Allgemeinen nicht eindeutig lösbar. Eine Interpolation von mehr als zwei Datenpunkten mit einem Polynom 1. Grades ist daher im Allgemeinen nicht möglich.
Für die Wahl des Ansatzraumes gibt es nun wie bei der Ausgleichsrechnung oder anderen Arten der Approximation viele Möglichkeiten. Hier wollen wir nur auf die wichtigste Art der Interpolation eingehen, die Polynominterpolation, bei der
der Funktionenraum aller Polynome vom Höchstgrad , also mit ist.
Wir betrachten also jetzt das folgende Problem (IP) der Interpolation durch ein Polynom:
(IP) Für gegebene Stützpunkte
(6.1)
mit Stützstellen
(6.2)
bestimme ein Interpolationspolynom mit
(6.3)
Die Bedingung (6.2) könnte man an einigen Stellen in diesem Kapitel fortlassen. Sie ist aber sinnvoll und wird insbesondere zum Beweis der Eindeutigkeit des Interpolationspolynoms im nächsten Satz benötigt.
Dies sind Gleichungen in den Unbekannten . Die zu diesen Gleichungen gehörende Systemmatrix ist die bereits aus Abschnitt 4.2 bekannte Vandermonde-Matrix
Ihre Determinante, die Vandermonde-Determinante, ist durch
gegeben (siehe R. Zurmühl: Matrizen und ihre technischen Anwendungen, Springer, Berlin, 1965). Wegen (6.2) ist und alles gezeigt.
q.e.d.
Der Beweis des letzten Satzes macht deutlich, dass man das Interpolationspolynom bestimmen kann, indem man das System (6.4) löst. Leider ist die zugehörige Systemmatrix, die Vandermonde-Matrix, sehr schlecht konditioniert, wie wir bereits in Abschnitt 4.2 festgestellt hatten. Daher ist von diesem Weg zur Lösung des Interpolationsproblems abzuraten. Wir geben im Folgenden andere Möglichkeiten der Bestimmung an, die aber alle auch Vor- und Nachteile haben.
6.2 Die Lagrangesche Darstellung des Interpolationspolynoms
Zu Stützstellen mit für sind die Langrangeschen Basispolynome definiert durch
Offenbar hat das Lagrangesche Basispolynom die Nullstellen und genügt es den Bedingungen
(6.5)
Da ein Polynom vom Höchstgrad ist und somit, wenn es nicht das Nullpolynom ist, maximal Nullstellen hat, folgt:
(6.6)
Das heißt, die sind linear unabhängig und es ist somit
Wegen
folgt damit
Die Funktionen bilden also eine Basis des Polynomraumes , so dass sich jedes Polynom vom Höchstgrad und damit auch das eindeutig bestimmte Interpolationspolynom als Linearkombination der darstellen lässt. Für die nach Satz 6.1 eindeutige Lösung des Interpolationsproblems (IP) ist diese Darstellung wegen (6.5) besonders einfach. Denn macht man für den Ansatz
so folgt mit (6.3) und (6.5)
und damit die Lagrangesche Darstellung des Interpolationspolynoms
(6.7)
Sie hat den Vorteil, dass man an ihr die Stützwerte für die Stützpunkte und damit die Interpolationsbedingungen (6.3) sofort ablesen kann.
Das Interpolationspolynom zu diesen Stützpunkten ist somit gegeben durch
Zum Beispiel für berechnet man
Man beachte, dass die Abbildung
die für vorgegebene, paarweise verschiedene jeder Menge von Stützwerten das eindeutige Interpolationspolynom zuordnet, linear ist.
Leider ist aber auch die Lagrangesche Darstellung des Interpolationspolynoms für praktische Rechnungen mit großem weniger geeignet. Denn die Berechnung von in einem Punkt für ein verlangt insgesamt Produkte und 1 Division, so dass für die Auswertung des Interpolationspolynoms an einer Stelle insgesamt , also wesentliche arithmetische Operationen benötigt werden. Außerdem erfordert die Lagrangesche Darstellung des Interpolationspolynomes im Fall der Hinzunahme eines Stützpunktes oder mehrerer Stützpunkte zu der ursprünglichen Stützpunktmenge die Neuberechnung aller und damit des gesamten Interpolationspolynoms.
Die Lösung für das Problem (IP), d. h. das Interpolationspolynom, kann auch schrittweise aus den Interpolationspolynomen für Stützpunkte berechnet werden. Um dies zu zeigen, benötigen wir:
Die Identität (6.9) ist wegen und richtig. Nun bezeichne die rechte Seite von (6.10), so dass zu zeigen ist.
Es gilt und und demnach . Weiter gilt
und für hat man
Wegen der Eindeutigkeit des Interpolationspolynoms (vgl. Satz 6.1) folgt .
q.e.d.
Die Formel (6.10) ist eine Rekursionsformel, die es ermöglicht, das Polynom vom Grad aus den beiden Polynomen und vom Grad zu bestimmen. Sie führt auf das Neville-Schema, bei dem sich die Einträge spaltenweise berechnen lassen:
Mit diesem Schema lässt sich das Interpolationspolynom an einzelnen Stellen auswerten. Dazu werden jeweils
Wir betrachten wieder die Stützpunkte aus Beispiel 6.3:
Für berechnet man
Demnach sieht das Neville-Schema hier wie folgt aus:
Bei Aufnahme eines neuen Stützpunktes oder mehrerer neuer Stützpunkte und Auswertung des Interpolationspolynoms an derselben Stelle wie zuvor, muss das Neville-Schema, anders als es eine Auswertung über die Lagrangesche Darstellung erfordern würde, nicht vollständig neu aufgestellt werden, sondern müssen nur entsprechende Zeilen am Ende des Schemas hinzugefügt werden. Falls ein Interpolationspolynom jedoch an mehreren Stellen zu bestimmen ist, sind trotzdem andere Methoden vorzuziehen. Eine davon wird im folgenden Abschnitt vorgestellt.
6.4 Die Newtonsche Darstellung des Interpolationspolynoms
Zu gegebenen Stützstellen sind die Newtonschen Basispolynome definiert durch
Man beachte dabei, dass das leere Produkt als 1 definiert, also ist. Ähnlich wie für die Lagrangeschen Basispolynome in (6.6) schließt man, dass die Newtonschen Basispolynome linear unabhängig sind und
ist. Jedes Polynom vom Höchstgrad lässt sich also auch nach Newtonschen Basispolynomen entwickeln. Insbesondere soll nun eine solche Entwicklung
(6.11)
d. h., sollen nun zugehörige Koeffizienten für das Interpolationspolynom bestimmt werden.
Die Koeffizienten in (6.11) lassen sich nacheinander aus den Gleichungen
gewinnen. Zur Berechnung der Koeffizienten des Interpolationspolynoms wären bei dieser Vorgehensweise
Multiplikationen und Divisionen und insgesamt arithmetische Operationen erforderlich. Eine Vorgehensweise, die dafür nur Divisionen und nur insgesamt arithmetische Operationen verlangt, soll im Folgenden vorgestellt werden.
Für Stützpunkte wie in (6.1) und (6.2) heißen die Zahlen
(6.12)
dividierte Differenzen, wobei und seien.
Man beachte, dass die dividierte Differenz von den Stützstellen und den Stützwerten abhängt. Die genauen Abhängigkeiten zwischen den einzelnen dividierten Differenzen können dem folgenden Tableau entnommen werden.
Zum Beispiel gilt
Zur Berechnung aller dividierten Differenzen für Stützpunkte werden insgesamt nur
Der Beweis wird per vollständiger Induktion über geführt. Die Behauptung ist sicher für richtig. Es sei nun angenommen, dass sie für beliebiges und beliebige Stützpunkte mit für richtig sei.
Seien nun Stützpunkte mit für gegeben und das zugehörige Interpolationspolynom. Mit den in Definition 6.4 definierten Polynomen gilt dann
und daher mit einer Konstanten ( ist möglich)
bzw.
(6.14)
Nach Induktionsvoraussetzung gilt nun so dass noch
zu zeigen bleibt.
Nach Satz 6.5 gilt
(6.15)
so dass die Behauptung per Koeffizientenvergleich folgt: wegen (6.14) muss a der Hauptkoeffizient von , d. h. muss
für ein gewisses Polynom sein. Weiter ist nach Induktionsvoraussetzung bekannt, dass und die Hauptkoeffizienten und haben und damit den folgenden Hauptkoeffizienten hat:
Somit ist alles gezeigt.
q.e.d.
Die Darstellung (6.13) nennt man die Newtonsche Darstellung des Interpolationspolynoms. Nimmt man einen weiteren Stützpunkt zu den ursprünglich Stützpunkten zusätzlich mit auf, so ändern sich offenbar die ersten Koeffizienten des Interpolationspolynoms in dieser Darstellung nicht und kann man den Koeffizienten berechnen, indem man im Schema der dividierten Differenzen unten eine zusätzliche Zeile für diesen Punkt berechnet.
Sind schließlich die Koeffizienten der Newtonschen Darstellung (6.11) des Interpolationspolynoms bekannt, so kann dieses für jedes effizient mit dem Horner-Schema
ausgewertet werden, wobei die Operationen von links nach rechts auszuführen sind.
Zum Abschluss zeigen wir die Vorgehensweise wieder an unserem Standardbeispiel.
Da für für nichts zu zeigen ist, nehmen wir für an. Sei nun
mit
so dass folgt. Also besitzt in dem Intervall mindestens paarweise verschiedene Nullstellen
Wiederholte Anwendung des Satzes von Rolle zeigt, dass in dem Intervall mindestens Nullstellen besitzt, mindestens usw. und somit mindestens noch eine Nullstelle . Nun gilt aber
wobei die zweite Identität aus der Tatsache folgt, dass den Hauptkoeffizienten 1 hat. Insgesamt erhält man damit
was den Beweis vervollständigt.
q.e.d.
Eine weitere Darstellung für den bei der Polynominterpolation entstehenden Fehler erhält man mittels dividierter Differenzen.
Für ist die Behauptung trivial und für folgt sie unmittelbar aus einem Vergleich der rechten Seiten in den Sätzen 6.11 und 6.12, wenn diese auf und angewandt werden.
q.e.d.
Wir wollen nun der Frage nachgehen, ob die Wahl von mehr Stützstellen automatisch auch zu einer Verringerung des bezüglich maximalen Interpolationsfehlers führt oder, anders ausgedrückt, ob der maximale Interpolationsfehler für eine Folge von Interpolationspolynomen zu zunehmend wachsender Zahl von Stützstellen gegen Null strebt. Dazu sei für jedes für den Rest des Unterabschnitts
(6.19)
mit einem eine Partition von und
ein Maß für die Feinheit der Unterteilung. Weiter sei das Interpolationspolynom zu mit den Stützstellen . Aus Satz 6.11 können wir dann zunächst das folgende Konvergenzergebnis schließen. Man beachte, dass dafür nicht gefordert ist.
Weiter sei eine Folge von Partitionen von der Form (6.19) mit . Dann konvergiert die Folge der zugehörigen Interpolationspolynome auf gleichmäßig gegen , d. h., es gilt
Allgemein kann man jedoch nicht erwarten, dass eine gegebene Funktion auf einem kompakten Intervall umso besser durch ein Interpolationspolynom approximiert wird, je feiner die Unterteilung der Stützstellen gewählt wird. Wie man zeigen kann, ist dafür die Funktion
ein Beispiel. Für deren Ableitungen in man
zeigen kann, so dass z. B. für mit einer Konstanten folgt:
In diesem Fall ist also auch die Voraussetzung von Satz 6.14 nicht erfüllt. Allgemein hat man in diesem Zusammenhang das folgende „Negativergebnis“, den Satz von Faber, welcher insbesondere für Folgen von Partitionen mit von Interesse ist. (Einen Beweis, der allerdings einiges voraussetzt, findet man bei E. W. Cheney: Introduction to Approximation Theory, 2nd edition, Chelsea, New York, 1982.)
Der Fehler des Interpolationspolynoms zu vorgegebenen Stützstellen wird durch (6.17) beschrieben. Da der Punkt in (6.17) i. a. unbekannt ist, macht es Sinn, statt der Darstellung (6.17) des Interpolationsfehlers die Abschätzung
(6.20)
zu betrachten. In diesem Abschnitt wird der Frage nachgegangen, für welche Stützstellen der darin stehende Ausdruck
am kleinsten wird, d. h. es soll das Minimax-Problem
gelöst werden. Da jedes Polynom vom Grad mit Hauptkoeffizientem 1 mit Hilfe seiner Nullstellen als Produkt geschrieben werden kann, ist also ein Polynom gesucht, welches unter allen Polynomen vom Grad mit Hauptkoeffizienten 1 die Maximumnorm bezüglich minimal macht. Wählt man die Nullstellen eines solchen Polynoms als Stützstellen, so erzeugt also das zugehörige Interpolationspolynom unter allen Interpolationspolynomen zu Stützpunkten die kleinste obere Fehlerschranke in (6.20).
Wir betrachten zunächst nur das Intervall . Es wird sich im Folgenden herausstellen, dass die gesuchten „optimalen“ Stützstellen gerade die Nullstellen des -ten Tschebyscheff-Polynoms erster Art sind.
(i) gilt offensichtlich und die Darstellungen für und in (ii) ergeben sich sofort aus der Definition (6.21). Für die Herleitung der Rekursionsformel (6.22) benötigen wir die Formel
Mit (i) liefert diese für und
Weiter folgt (iii) aus der Rekursionsformel (ii) und folgt (iv) mit (i) wegen
Schließlich sind die Aussagen (v) und (vi) offensichtlich richtig.
q.e.d.
Nach Satz 6.18 (iii) und (v) gilt mit den Nullstellen von wie in (6.24) die Darstellung
(6.26)
Der folgende Satz besagt nun, dass dieses Polynom unter allen Polynomen vom Grad mit Hauptkoeffizienten 1 die Maximumnorm auf minimal macht und dass man überdies den zugehörigen Wert dieser Norm auch angeben kann.
Die zweite Identität folgt aus (6.26) mit Satz 6.18 (iv). Weiter ist bei der ersten Identität in (6.27) die Abschätzung „“ offensichtlich. Die Abschätzung „“ soll nun durch eine Widerspruchsannahme nachgewiesen werden.
Angenommen, es gibt Zahlen mit
(6.28)
für . Also ist insbesondere
(6.29)
Für das Polynom
schließt man mit (6.25) und (6.29)
Also hat mindestens Vorzeichenwechsel in und gilt allgemein
Das Polynom besitzt demnach einfache paarweise verschiedene Nullstellen in . Nun ist sowohl als auch ein Polynom vom Grad und besitzen beide Funktionen den führenden Koeffizienten 1, so dass notwendigerweise gilt. Da im Fall nur höchstens paarweise verschiedene Nullstellen haben kann, folgt bzw.
was aber wegen Satz 6.18 (iv) und (6.29) der Annahme (6.28) widerspricht.
q.e.d.
Damit haben wir den Fall behandelt. Abschließend werden wir nun noch allgemeine Intervalle betrachten. Dazu verwenden wir die affin-lineare Transformation
(6.30)
mit welcher der nachfolgende Satz leicht aus Satz 6.19 zu schließen ist.
Die Identität (6.32) ergibt sich mit Satz 6.19 unter Verwendung von (6.30) aus
Weiter ist in (6.31) sicher die Ungleichung „“ richtig. Zum Beweis der Ungleichung „“ seien nun beliebig. Dann gibt es eindeutig bestimmte Zahlen mit für und mit diesen erhält man ähnlich wie im ersten Teil des Beweises
Sei und das Interpolationspolynom zu den Stützpunkten mit für aus (6.30) und wie in (6.24). Dann gilt für den Interpolationsfehler
(6.33)
Man beachte aber, dass nach dem Satz von Faber 6.16 auch bei Wahl der Tschebyscheff-Knoten die Interpolationspolynome mit wachsendem nicht gleichmäßig auf gegen konvergieren müssen.
Gegeben sei die Funktion , welche im Intervall in 5 Punkten durch ein Interpolationspolynom möglichst kleinen Grades so interpoliert werden soll, dass die maximale Schranke für den Approximationsfehler möglichst klein ausfällt. Die Stützstellen sind dann gemäß Korollar 6.21 zu wählen. Da der erste Punkt den Index 0 hat, ist hier . Mit
und (6.24) lauten die gesuchten Stützstellen
Demnach errechnet man mit
Man hat weiter für
und damit
Für das Interpolationspolynom zu den berechneten Stützpunkten kann man also gemäß (6.33) die folgende maximale Abweichung von auf vorhersagen:
Abschließend sei noch gesagt, dass ein Nachteil der in diesem gesamten Kapitel dargestellten Form der Interpolation ihrer großen Fehlerempfindlichkeit ist. Fehlerhafte Daten wirken sich nicht nur lokal bei der Stützstelle aus, sondern verändern den Verlauf über das ganze Intervall hinweg relativ stark. Dies wird an dem folgenden einfachen Beispiel deutlich.
Darstellung des Interpolationspolynoms und damit des auf bezogenen Interpolationsfehlers für z. B. zeigt, dass durch „Messfehler“ und an der Stelle sehr unterschiedlich verändert wird und zwar keineswegs nur an der Stelle .