Suche im Lexikon
Lexikon auf Ihrer Homepage Lexikon als Lesezeichen hinzufügen

Satz von der impliziten Funktion

Der Satz von der impliziten Funktion ist einer der wichtigsten Sätze in der Analysis. Er beinhaltet ein relativ einfaches Kriterium, wann eine implizite Gleichung oder ein Gleichungssystem (lokal) eindeutig aufgelöst werden kann.

Inhaltsverzeichnis

Begriffsbestimmung

Eine implizit definierte Funktion (kurz implizite Funktion) ist eine Funktion, die nicht in der „einfachen“ Zuordnungsvorschrift y=f(x) gegeben ist, sondern deren Funktionswerte implizit durch eine Gleichung <math>F(x,y)=0</math> definiert sind. Dabei ist F eine vektorwertige Funktion, die genauso viele Einzelfunktionen enthält, wie y Komponenten hat. Wird x fixiert, so ergibt sich ein Gleichungssystem in y mit genauso vielen Gleichungen wie Unbekannten. Der Satz über die implizite Funktion beschreibt Voraussetzungen, unter denen die folgende Aussage gilt:

Wenn eine Lösung <math>y_0</math> für einen Parametervektor <math>x_0</math> bekannt ist, dann kann für jeden Parametervektor <math>x\approx x_0</math> in einer kleinen Umgebung von <math>x_0</math> auch immer eine eindeutig bestimmte Lösung <math>y\approx y_0</math> des Gleichungssystems <math>F(x,y)=0</math> gefunden werden, die in einer Umgebung der ursprünglichen Lösung <math>y_0</math> liegt.

Diese Aussage des Satzes erlaubt nun, eine Funktion <math>f</math> zu definieren, die jedem Parametervektor <math>x\approx x_0</math> gerade den Lösungsvektor <math>y=f(x)\approx y_0</math> zuordnet, sodass diese Funktion auf ihrem Definitionsbereich die Gleichung <math>F(x,f(x))=0</math> erfüllt. Der Satz von der impliziten Funktion stellt zudem sicher, dass diese Zuordnung <math>x\mapsto f(x)</math> unter gewissen Bedingungen und Einschränkungen an F, x und y wohldefiniert ist, insbesondere, dass sie eindeutig ist.

Der Einheitskreis wird als die Menge aller Punkte (x,y) beschrieben, welche die Gleichung <math>F(x,y)=0</math> erfüllen, mit <math>F(x,y)=x^2+y^2-1</math>. In einer Umgebung des Punktes A kann <math>y</math> als Funktion von <math>x</math> ausgedrückt werden: <math>y=f(x)=\sqrt{1-x^2}</math>. Bei Punkt B geht das nicht.

Motivierendes Beispiel

Setzt man <math>F(x,y)=x^2+y^2-1</math>, so beschreibt die Gleichung <math>F(x,y)=0</math> den Einheitskreis in der Ebene. Der Einheitskreis kann nicht als Graph einer Funktion <math>y=f(x)</math> geschrieben werden, denn zu jedem <math>x</math> aus dem Intervall <math>(-1,1)</math> gibt es zwei Möglichkeiten für <math>y</math>, nämlich <math>y=\pm\sqrt{1-x^2}</math>.

Es ist jedoch möglich, Teile des Kreises als Funktionsgraph darzustellen. Den oberen Halbkreis bekommt man als Graph der Funktion

<math>f_1\colon (-1,1) \to \R, f_1(x)=\sqrt{1-x^2}</math>,

den unteren als Graph von

<math>f_2\colon (-1,1) \to \R, f_2(x)=-\sqrt{1-x^2}</math>.

Der Satz von der impliziten Funktion gibt Kriterien für die Existenz von Funktionen wie <math>f_1</math> oder <math>f_2</math>. Er garantiert auch, dass diese Funktionen differenzierbar sind.

Satz von der impliziten Funktion

Aussage

Seien <math>U \subseteq \mathbb{R}^m</math> und <math>V \subseteq \mathbb{R}^n</math> offene Teilmengen und

<math> F\colon U \times\, V \to \mathbb{R}^n,\quad (x,y)=(x_1,\dots,x_m,y_1,\dots,y_n) \mapsto F(x,y)=(\,F_1(x,y),\dots,F_n(x,y)\,) </math>

eine stetig differenzierbare Abbildung. Die Jacobi-Matrix

<math>
 DF = \frac{\partial F}{\partial (x, y)} 
 = \frac{\partial (F_1,\dots,F_n)}{\partial(x_1,\dots,x_m,y_1,\dots,y_n)}
 = \begin{pmatrix}
 \frac{\partial F_1}{\partial x_1} & \cdots & \frac{\partial F_1}{\partial x_m} &
    \frac{\partial   F_1}{\partial y_1} & \cdots & \frac{\partial F_1}{\partial y_n} \\ 
 \vdots & & \vdots &\vdots & & \vdots \\ 
 \frac{\partial F_n}{\partial x_1} & \cdots & \frac{\partial F_n}{\partial x_m} &
    \frac{\partial F_n}{\partial y_1} & \cdots & \frac{\partial F_n}{\partial y_n} 
 \end{pmatrix}

</math> besteht dann aus zwei Teilmatrizen

<math>\frac{\partial F}{\partial x}
 = \frac{\partial (F_1,\dots,F_n)}{\partial(x_1,\dots,x_m)}
 = \begin{pmatrix}
 \frac{\partial F_1}{\partial x_1} & \cdots & \frac{\partial F_1}{\partial x_m} \\ 
 \vdots & & \vdots  \\ 
 \frac{\partial F_n}{\partial x_1} & \cdots & \frac{\partial F_n}{\partial x_m}  
 \end{pmatrix}

</math> und

<math>\frac{\partial F}{\partial y}
 = \frac{\partial (F_1,\dots,F_n)}{\partial(y_1,\dots,y_n)}
 = \begin{pmatrix}
 \frac{\partial F_1}{\partial y_1} & \cdots & \frac{\partial F_1}{\partial y_n} \\ 
 \vdots & & \vdots  \\ 
 \frac{\partial F_n}{\partial y_1} & \cdots & \frac{\partial F_n}{\partial y_n}  
 \end{pmatrix},

</math> wobei letztere quadratisch ist.

Der Satz von der impliziten Funktion besagt nun:

Erfüllt <math> (x_0, y_0) \in U \times\ V </math> die Gleichung <math>F(x_0, y_0)=0</math> und ist die zweite Teilmatrix <math> \tfrac{\partial F}{\partial y}</math> im Punkt <math> (x_0,y_0) </math> invertierbar, so existieren offene Umgebungen <math>U_0</math> von <math>x_0</math> und <math>V_0</math> von <math>y_0</math> sowie eine eindeutige stetig differenzierbare Abbildung

<math> f\colon {U_0} \subseteq {U} \subseteq {\mathbb{R}^m} \to {V_0} \subseteq {V} \subseteq {\mathbb{R}^n} </math>,

mit <math>f(x_0) = y_0</math> so, dass

<math>F\big(x, f(x)\big)=0</math>

für alle <math> x \in U_0</math> gilt.

Beispiel

Man wende nun diesen Satz auf das anfangs gegebene Beispiel der Kreisgleichung an: Dazu sind die partiellen Ableitungen nach den y-Variablen zu betrachten. (In diesem Fall ist n=1, also ergibt das eine 1×1 Matrix, beziehungsweise einfach eine reelle Funktion): Die partielle Ableitung der Funktion <math> F(x,y) = x^2 + y^2 -1 </math> nach y ergibt <math> \tfrac{\partial F(x,y)}{\partial y} = 2 y </math>. Diese Ableitung hat einen Kehrwert genau dann, wenn <math> y \neq 0 </math> ist. Damit folgert man mit Hilfe des Satzes, dass diese Gleichung lokal nach y auflösbar ist, wenn <math>y \neq 0</math>. Der Fall <math>y=0</math> tritt nur in den Punkten <math>x = -1</math> oder <math>x = 1</math> auf. Dies sind also die Problempunkte. Tatsächlich sieht man, dass die Formel <math> y = \pm \sqrt{1 - x^2} </math> sich genau in diesen Problempunkten in eine positive und negative Lösung verzweigt. In allen anderen Punkten ist die Auflösung lokal eindeutig.

Beweisansatz

Der klassische Ansatz betrachtet zur Lösung der Gleichung <math>F(x,y)=0</math> das Anfangswertproblem der gewöhnlichen Differentialgleichung

<math>
   \phi_v'(t)=-G(x_0+tv,\phi_v(t))
 \;\text{ mit }\;
   G(x,y)=\left(\tfrac{\partial F}{\partial y}(x,y)\right)^{-1}\tfrac{\partial F}{\partial x}(x,y)
 \;\text{ und }\;
  \phi_v(0)=y_0
 </math>.

Da <math>\tfrac{\partial F}{\partial y}</math> in <math>(x_0,y_0)</math> invertierbar ist, ist dies auch in einer kleinen Umgebung der Fall, d.h. für kleine Vektoren v existiert die Differentialgleichung und ihre Lösung für alle <math>t\in [0,1]</math>. Die Lösung der impliziten Gleichung ist nun durch

<math>f(x)=\phi_{x-x_0}(1)</math>

gegeben, die oben angegebenen Eigenschaften dieser Lösung ergeben sich aus den Eigenschaften der Lösungen parameterabhängiger Differentialgleichungen.

Der moderne Ansatz formuliert das Gleichungssystem <math>F(x,y)=0</math> mit Hilfe des vereinfachten Newton-Verfahrens als Fixpunktproblem und wendet darauf den Fixpunktsatz von Banach an. Für die dazugehörige Fixpunktabbildung wird die Inverse A der Teilmatrix <math>\tfrac{\partial F}{\partial y}(x_0,y_0)</math> der Jacobi-Matrix von F im vorgegebenen Lösungspunkt <math>(x_0,y_0)</math> gebildet. Zu der Abbildung

<math>T(y)=y-A\,F(x,y)</math>

kann man nun zeigen, dass für Parametervektoren x nahe <math>x_0</math> diese Abbildung auf einer Umgebung von <math>y_0</math> kontraktiv ist. Dies folgt daraus, dass T stetig differenzierbar ist und <math>\tfrac{\partial T}{\partial y}(x_0,y_0)=0</math> gilt.

Zusammenfassung

Der Vorteil des Satzes ist, dass man die explizite Funktion <math>f</math> gar nicht kennen muss, und trotzdem eine Aussage über deren Existenz und Eindeutigkeit folgern kann. In vielen Fällen ist die Gleichung für <math>y</math> auch gar nicht mit Formeln lösbar, sondern nur mit numerischen Verfahren. Interessant ist, dass die Konvergenz solcher Verfahren meist gleiche oder ähnliche Voraussetzung wie der Satz von der impliziten Funktion (Matrix der y-Ableitungen muss invertierbar sein) erfordert.

Eine weitere wertvolle Schlussfolgerung des Satzes ist, dass die Funktion <math>f</math> differenzierbar ist, falls <math>F(x,y)</math> es ist, was bei Anwendung des Satzes über implizite Funktionen vorausgesetzt wird. Die Ableitung kann sogar explizit angegeben werden, indem man die Gleichung <math>F(x,f(x)) = 0</math> nach der mehrdimensionalen Kettenregel ableitet:

<math>\frac{\partial F}{\partial x}(x,f(x)) + \frac{\partial F}{\partial y}(x,f(x)) \cdot \frac{\partial f}{\partial x}(x) = 0</math>

und dann nach <math>\frac{\partial f}{\partial x}(x)</math> auflöst:

<math> \frac{\partial f }{\partial x}(x) = - \left( \frac{\partial F }{\partial y}(x,f(x)) \right)^{-1} \cdot \frac{\partial F }{\partial x}\big(x,f(x)\big) </math>.

Eine ähnliche Folgerung gilt für höhere Ableitungen. Ersetzt man die Voraussetzung "<math>F</math> ist stetig differenzierbar", durch "<math>F</math> ist <math>k</math>-mal stetig differenzierbar" (oder beliebig oft oder analytisch), kann man folgern, dass <math>f</math> <math>k</math>-mal differenzierbar (bzw. beliebig oft bzw. analytisch) ist.

Satz von der Umkehrabbildung

Ein nützliches Korollar zum Satz von der impliziten Funktion ist der Satz von der Umkehrabbildung. Er gibt eine Antwort auf die Frage, wann man eine Umkehrfunktion finden kann:

Sei <math>U \subseteq \mathbb{R}^n</math> offen und

<math>f : U \to \mathbb{R}^n</math>

eine stetig differenzierbare Abbildung. Sei <math>a \in U</math> und <math>b := f(a)</math>. Die Jacobi-Matrix <math>\mathrm{D}f(a)</math> sei invertierbar. Dann gibt es eine offene Umgebung <math>U_a \subseteq U</math> von a und eine offene Umgebung <math>V_b</math> von b, so dass f die Menge <math>U_a</math> bijektiv auf <math>V_b</math> abbildet und die Umkehrfunktion

<math>g = f^{-1} : V_b \to U_a</math>

stetig differenzierbar ist. Es gilt

<math>\mathrm{D} (f^{-1})(b) = \mathrm{D} g(b) = (\mathrm{D} f(a))^{-1} = (\mathrm{D} f(g(b)))^{-1}</math>

Literatur

  • Herbert Amann, Joachim Escher: Analysis II. Birkhäuser, Basel, 1999, ISBN 3-7643-6133-6, S. 230 ff.
  •  Otto Forster: Analysis 2. 7. Auflage. Vieweg, Wiesbaden 2006, ISBN 3-8348-0250-6, I.8 Implizite Funktionen, S. 86 - 99.</span>
Impressum AGB Datenschutz KundenserviceMediadatenfreenet AGJobsSitemap
gekennzeichnet mit
JUSPROG e.V. - Jugendschutz
freenet ist Mitglied im JUSPROG e.V.