|
|
Lexikon auf Ihrer Homepage |
|
Lexikon als Lesezeichen hinzufügen |
Der Satz von der impliziten Funktion ist einer der wichtigsten Sätze in der Analysis. Er beinhaltet ein relativ einfaches Kriterium, wann eine implizite Gleichung oder ein Gleichungssystem (lokal) eindeutig aufgelöst werden kann.
Inhaltsverzeichnis |
Eine implizit definierte Funktion (kurz implizite Funktion) ist eine Funktion, die nicht in der „einfachen“ Zuordnungsvorschrift y=f(x) gegeben ist, sondern deren Funktionswerte implizit durch eine Gleichung <math>F(x,y)=0</math> definiert sind. Dabei ist F eine vektorwertige Funktion, die genauso viele Einzelfunktionen enthält, wie y Komponenten hat. Wird x fixiert, so ergibt sich ein Gleichungssystem in y mit genauso vielen Gleichungen wie Unbekannten. Der Satz über die implizite Funktion beschreibt Voraussetzungen, unter denen die folgende Aussage gilt:
Diese Aussage des Satzes erlaubt nun, eine Funktion <math>f</math> zu definieren, die jedem Parametervektor <math>x\approx x_0</math> gerade den Lösungsvektor <math>y=f(x)\approx y_0</math> zuordnet, sodass diese Funktion auf ihrem Definitionsbereich die Gleichung <math>F(x,f(x))=0</math> erfüllt. Der Satz von der impliziten Funktion stellt zudem sicher, dass diese Zuordnung <math>x\mapsto f(x)</math> unter gewissen Bedingungen und Einschränkungen an F, x und y wohldefiniert ist, insbesondere, dass sie eindeutig ist.
Setzt man <math>F(x,y)=x^2+y^2-1</math>, so beschreibt die Gleichung <math>F(x,y)=0</math> den Einheitskreis in der Ebene. Der Einheitskreis kann nicht als Graph einer Funktion <math>y=f(x)</math> geschrieben werden, denn zu jedem <math>x</math> aus dem Intervall <math>(-1,1)</math> gibt es zwei Möglichkeiten für <math>y</math>, nämlich <math>y=\pm\sqrt{1-x^2}</math>.
Es ist jedoch möglich, Teile des Kreises als Funktionsgraph darzustellen. Den oberen Halbkreis bekommt man als Graph der Funktion
den unteren als Graph von
Der Satz von der impliziten Funktion gibt Kriterien für die Existenz von Funktionen wie <math>f_1</math> oder <math>f_2</math>. Er garantiert auch, dass diese Funktionen differenzierbar sind.
Seien <math>U \subseteq \mathbb{R}^m</math> und <math>V \subseteq \mathbb{R}^n</math> offene Teilmengen und
eine stetig differenzierbare Abbildung. Die Jacobi-Matrix
DF = \frac{\partial F}{\partial (x, y)}
= \frac{\partial (F_1,\dots,F_n)}{\partial(x_1,\dots,x_m,y_1,\dots,y_n)}
= \begin{pmatrix}
\frac{\partial F_1}{\partial x_1} & \cdots & \frac{\partial F_1}{\partial x_m} &
\frac{\partial F_1}{\partial y_1} & \cdots & \frac{\partial F_1}{\partial y_n} \\
\vdots & & \vdots &\vdots & & \vdots \\
\frac{\partial F_n}{\partial x_1} & \cdots & \frac{\partial F_n}{\partial x_m} &
\frac{\partial F_n}{\partial y_1} & \cdots & \frac{\partial F_n}{\partial y_n}
\end{pmatrix}
</math> besteht dann aus zwei Teilmatrizen
= \frac{\partial (F_1,\dots,F_n)}{\partial(x_1,\dots,x_m)}
= \begin{pmatrix}
\frac{\partial F_1}{\partial x_1} & \cdots & \frac{\partial F_1}{\partial x_m} \\
\vdots & & \vdots \\
\frac{\partial F_n}{\partial x_1} & \cdots & \frac{\partial F_n}{\partial x_m}
\end{pmatrix}
</math> und
= \frac{\partial (F_1,\dots,F_n)}{\partial(y_1,\dots,y_n)}
= \begin{pmatrix}
\frac{\partial F_1}{\partial y_1} & \cdots & \frac{\partial F_1}{\partial y_n} \\
\vdots & & \vdots \\
\frac{\partial F_n}{\partial y_1} & \cdots & \frac{\partial F_n}{\partial y_n}
\end{pmatrix},
</math> wobei letztere quadratisch ist.
Der Satz von der impliziten Funktion besagt nun:
Erfüllt <math> (x_0, y_0) \in U \times\ V </math> die Gleichung <math>F(x_0, y_0)=0</math> und ist die zweite Teilmatrix <math> \tfrac{\partial F}{\partial y}</math> im Punkt <math> (x_0,y_0) </math> invertierbar, so existieren offene Umgebungen <math>U_0</math> von <math>x_0</math> und <math>V_0</math> von <math>y_0</math> sowie eine eindeutige stetig differenzierbare Abbildung
mit <math>f(x_0) = y_0</math> so, dass
für alle <math> x \in U_0</math> gilt.
Man wende nun diesen Satz auf das anfangs gegebene Beispiel der Kreisgleichung an: Dazu sind die partiellen Ableitungen nach den y-Variablen zu betrachten. (In diesem Fall ist n=1, also ergibt das eine 1×1 Matrix, beziehungsweise einfach eine reelle Funktion): Die partielle Ableitung der Funktion <math> F(x,y) = x^2 + y^2 -1 </math> nach y ergibt <math> \tfrac{\partial F(x,y)}{\partial y} = 2 y </math>. Diese Ableitung hat einen Kehrwert genau dann, wenn <math> y \neq 0 </math> ist. Damit folgert man mit Hilfe des Satzes, dass diese Gleichung lokal nach y auflösbar ist, wenn <math>y \neq 0</math>. Der Fall <math>y=0</math> tritt nur in den Punkten <math>x = -1</math> oder <math>x = 1</math> auf. Dies sind also die Problempunkte. Tatsächlich sieht man, dass die Formel <math> y = \pm \sqrt{1 - x^2} </math> sich genau in diesen Problempunkten in eine positive und negative Lösung verzweigt. In allen anderen Punkten ist die Auflösung lokal eindeutig.
Der klassische Ansatz betrachtet zur Lösung der Gleichung <math>F(x,y)=0</math> das Anfangswertproblem der gewöhnlichen Differentialgleichung
\phi_v'(t)=-G(x_0+tv,\phi_v(t))
\;\text{ mit }\;
G(x,y)=\left(\tfrac{\partial F}{\partial y}(x,y)\right)^{-1}\tfrac{\partial F}{\partial x}(x,y)
\;\text{ und }\;
\phi_v(0)=y_0
</math>.
Da <math>\tfrac{\partial F}{\partial y}</math> in <math>(x_0,y_0)</math> invertierbar ist, ist dies auch in einer kleinen Umgebung der Fall, d.h. für kleine Vektoren v existiert die Differentialgleichung und ihre Lösung für alle <math>t\in [0,1]</math>. Die Lösung der impliziten Gleichung ist nun durch
gegeben, die oben angegebenen Eigenschaften dieser Lösung ergeben sich aus den Eigenschaften der Lösungen parameterabhängiger Differentialgleichungen.
Der moderne Ansatz formuliert das Gleichungssystem <math>F(x,y)=0</math> mit Hilfe des vereinfachten Newton-Verfahrens als Fixpunktproblem und wendet darauf den Fixpunktsatz von Banach an. Für die dazugehörige Fixpunktabbildung wird die Inverse A der Teilmatrix <math>\tfrac{\partial F}{\partial y}(x_0,y_0)</math> der Jacobi-Matrix von F im vorgegebenen Lösungspunkt <math>(x_0,y_0)</math> gebildet. Zu der Abbildung
kann man nun zeigen, dass für Parametervektoren x nahe <math>x_0</math> diese Abbildung auf einer Umgebung von <math>y_0</math> kontraktiv ist. Dies folgt daraus, dass T stetig differenzierbar ist und <math>\tfrac{\partial T}{\partial y}(x_0,y_0)=0</math> gilt.
Der Vorteil des Satzes ist, dass man die explizite Funktion <math>f</math> gar nicht kennen muss, und trotzdem eine Aussage über deren Existenz und Eindeutigkeit folgern kann. In vielen Fällen ist die Gleichung für <math>y</math> auch gar nicht mit Formeln lösbar, sondern nur mit numerischen Verfahren. Interessant ist, dass die Konvergenz solcher Verfahren meist gleiche oder ähnliche Voraussetzung wie der Satz von der impliziten Funktion (Matrix der y-Ableitungen muss invertierbar sein) erfordert.
Eine weitere wertvolle Schlussfolgerung des Satzes ist, dass die Funktion <math>f</math> differenzierbar ist, falls <math>F(x,y)</math> es ist, was bei Anwendung des Satzes über implizite Funktionen vorausgesetzt wird. Die Ableitung kann sogar explizit angegeben werden, indem man die Gleichung <math>F(x,f(x)) = 0</math> nach der mehrdimensionalen Kettenregel ableitet:
und dann nach <math>\frac{\partial f}{\partial x}(x)</math> auflöst:
Eine ähnliche Folgerung gilt für höhere Ableitungen. Ersetzt man die Voraussetzung "<math>F</math> ist stetig differenzierbar", durch "<math>F</math> ist <math>k</math>-mal stetig differenzierbar" (oder beliebig oft oder analytisch), kann man folgern, dass <math>f</math> <math>k</math>-mal differenzierbar (bzw. beliebig oft bzw. analytisch) ist.
Ein nützliches Korollar zum Satz von der impliziten Funktion ist der Satz von der Umkehrabbildung. Er gibt eine Antwort auf die Frage, wann man eine Umkehrfunktion finden kann:
Sei <math>U \subseteq \mathbb{R}^n</math> offen und
eine stetig differenzierbare Abbildung. Sei <math>a \in U</math> und <math>b := f(a)</math>. Die Jacobi-Matrix <math>\mathrm{D}f(a)</math> sei invertierbar. Dann gibt es eine offene Umgebung <math>U_a \subseteq U</math> von a und eine offene Umgebung <math>V_b</math> von b, so dass f die Menge <math>U_a</math> bijektiv auf <math>V_b</math> abbildet und die Umkehrfunktion
stetig differenzierbar ist. Es gilt