|
|
Lexikon auf Ihrer Homepage |
|
Lexikon als Lesezeichen hinzufügen |
Die Kettenregel ist eine der Grundregeln der Differentialrechnung. Sie trifft Aussagen über die Ableitung einer Funktion, die sich selbst als Verkettung von zwei differenzierbaren Funktionen darstellen lässt. Kernaussage der Kettenregel ist dabei, dass eine solche Funktion selbst wieder differenzierbar ist und man ihre Ableitung erhält, indem man die beiden miteinander verketteten Funktionen separat ableitet und – ausgewertet an den richtigen Stellen – miteinander multipliziert.
Die Kettenregel lässt sich verallgemeinern auf Funktionen, die sich als Verkettung von mehr als zwei differenzierbaren Funktionen darstellen lassen. Auch eine solche Funktion ist wiederum differenzierbar, ihre Ableitung erhält man durch Multiplikation der Ableitungen aller ineinander verschachtelten Funktionen.
Die Kettenregel bildet einen Spezialfall der verallgemeinerten Kettenregel für den eindimensionalen Fall.
Sie ist außerdem das Gegenstück zur Integration durch Substitution in der Integralrechnung.
Seien U, V offene Intervalle, <math> v\colon V \rightarrow \mathbb{R} </math> und <math> u\colon U \rightarrow \mathbb{R} </math> Funktionen mit <math> v(V) \subset U </math>.
Die Funktion <math>v</math> sei im Punkt <math> x_0 \in V </math> differenzierbar und <math>u</math> sei im Punkt <math> z_0 := v(x_0) \in U </math> differenzierbar.
Dann ist die zusammengesetzte Funktion
im Punkt <math>x_0</math> differenzierbar und es gilt:
Im Zusammenhang mit der Kettenregel nennt man <math>u</math> auch die äußere, <math>v</math> die innere Funktion von <math>f</math>.
Praktische Merkregel: Die Ableitung einer durch Verkettung gebildeten Funktion ist die „äußere Ableitung“ <math>u'</math> - ausgewertet an der Stelle <math>v(x_0)</math> - mal der Ableitung der inneren Funktion <math>v'</math> - ausgewertet an der Stelle <math>x_0</math>. Oder kurz: „Äußere Ableitung mal innere Ableitung“.
Es wird die durch <math>f(x) = (x^3+1)^2</math> definierte Funktion <math>f</math> betrachtet.
Diese lässt sich darstellen als Verkettung der Funktion
mit der Funktion
denn es gilt <math>f(x) = u(v(x))</math>. In der Terminologie der Kettenregel bezeichnet <math>u</math> die äußere, <math>v</math> die innere Funktion. Es ist üblich, der Übersicht halber in der äußeren Funktion die unabhängige Variable mit dem Funktionssymbol der inneren Funktion zu identifizieren, obwohl die Benennung der Variable prinzipiell keine Rolle spielt. Man könnte gleichwertig für die erste Funktion auch <math> u(x) = x^2 </math> schreiben.
Für die Anwendung der Kettenregel benötigen wir die Ableitungen <math>u'</math> ("äußere Ableitung") und <math>v'</math> ("innere Ableitung"):
und
Da sowohl <math>u</math> als auch <math>v</math> differenzierbar sind, ist nach der Kettenregel auch <math>f = u \circ v</math> differenzierbar, und es gilt für ihre Ableitung:
Nun ist <math>u'(v(x)) = 2(x^3 + 1)</math>, so dass wir insgesamt erhalten:
Man beachte, dass die Darstellung einer Funktion als Verkettung einer äußeren mit einer inneren Funktion keineswegs eindeutig sein muss. So lässt sich die Beispielfunktion auch als Verkettung der Funktionen <math> u(v) = (v + 1)^2 </math> und <math> v(x) = x^3 </math> auffassen, denn auch für diese beiden Funktionen gilt:
Die Anwendung der Kettenregel ist in diesem Fall rechnerisch aufwändiger, da zumindest der Term <math>(v+1)^2</math> ausmultipliziert werden muss.
Insgesamt lässt sich an diesem Beispiel die Kettenregel im Sinne der konstruktivistischen Didaktik selbst entdecken. Ausmultiplizieren ergibt:
Nach Ableiten wird durch Ausklammern die innere Funktion <math>v(x)=x^3+1</math> herauspräpariert:
Hieraus lässt sich dann die Kettenregel vermuten, die dann noch in ihrer Allgemeingültigkeit bewiesen werden muss.
Von x zum Funktionswert u(v(x)) kann man gelangen, indem man zuerst v(x) und dann u(v) berechnet. Die Funktion v(x) hat die Steigung v'(x) (innere Ableitung). Die Funktion u(v) hat die Steigung u'(v) (äußere Ableitung). Die Steigung von u(v(x)) ist u'(x) (Gesamtableitung).
Der Term <math>{\Delta u \over \Delta v} \cdot {\Delta v \over \Delta x}</math> entsteht dabei durch Erweiterung des Bruchs <math> {\Delta u \over \Delta x}</math> mit <math>\Delta v</math>, also Multiplikation mit <math> {\Delta v \over \Delta v}</math> und Umschreibung. Zu beachten ist hierbei: Die Verkettung von Funktionen ist etwas ganz anderes als die Multiplikation von Funktionen.
Für die Differenzenquotienten gilt (siehe Abbildung): <math> {\Delta u \over \Delta x} = {\Delta u \over \Delta v} \cdot {\Delta v \over \Delta x}</math>
Durch den Grenzübergang Δx → 0 werden aus den Differenzenquotienten die Differentialquotienten. Aus der obigen Abbildung geht hervor: Geht Δx gegen Null, dann auch Δv.
Man erhält dann insgesamt für die Ableitung der verketteten Funktion:
Anmerkung: Die hier verwendete Schreibweise mit Differentialen (z. B. <math>\mathrm dx</math>) nach Leibniz ist äquivalent zur obigen Schreibweise nach Lagrange, vgl. auch den letzten Absatz dieses Artikels.
Sei
D(z,z_0) :=
\begin{cases}
\frac {u(z)-u(z_0)} {z-z_0}, & \text{falls } z \ne z_0, \\
u'(z_0), & \text{falls } z = z_0.
\end{cases}
</math> Weil <math>u</math> in <math> z_0 </math> differenzierbar ist, gilt
das heißt, <math>D(z,z_0)</math> ist bei <math>z=z_0</math> stetig. Außerdem gilt für alle <math>z \in U</math>
Daraus folgt
\begin{align}
(u \circ v)'(x_0)
&= \lim_{x \to x_0}\frac{u\big(v(x)\big)-u\big(v(x_0)\big)}{x-x_0}
= \lim_{x \to x_0}\frac{D\big(v(x),v(x_0)\big)\cdot\big(v(x)-v(x_0)\big)}{x-x_0} \\
&= \lim_{x \to x_0} D\big(v(x),v(x_0)\big)\cdot\lim_{x \to x_0}\frac{v(x)-v(x_0)}{x-x_0} \\
&= u'\big(v(x_0)\big)\cdot v'(x_0).
\end{align} </math>
Etwas komplizierter wird das Differenzieren, wenn mehr als zwei Funktionen verkettet sind. In diesem Fall wird die Kettenregel rekursiv angewendet. Beispielsweise ergibt sich bei Verkettung von drei Funktionen u, v und w
die Ableitung
Im Allgemeinen besitzt die Funktion
die Ableitung
wie sich durch vollständige Induktion beweisen lässt. Beim praktischen Berechnen der Ableitung multipliziert man also Faktoren, die sich folgendermaßen ergeben:
Den ersten Faktor erhält man dadurch, dass man die äußerste Funktion durch eine unabhängige Variable ausdrückt und ableitet. Anstelle dieser unabhängigen Variablen ist der Rechenausdruck für die restlichen (inneren) Funktionen einzusetzen. Der zweite Faktor wird entsprechend berechnet als Ableitung der zweitäußersten Funktion, wobei auch hier der Rechenausdruck für die zugehörigen inneren Funktionen einzusetzen ist. Dieses Verfahren setzt man fort bis zum letzten Faktor, der innersten Ableitung.
Als Beispiel kann wiederum die Funktion <math>f(x) = (x^3 + 1)^2</math> dienen. Diese lässt sich darstellen als Verkettung der drei Funktionen:
u(v) &=& v^2 \\
v(w) &=& w + 1 \\
w(x) &=& x^3,
\end{array} </math>
denn es gilt:
Damit liefert die auf mehrfache Verkettungen verallgemeinerte Kettenregel mit
u'(v) &=& 2v \\
v'(w) &=& 1 \\
w'(x) &=& 3x^2,
\end{array} </math>
die Ableitung
Eine Verallgemeinerung für höhere Ableitungen ist wesentlich komplizierter und schwieriger zu beweisen. Sie ist als Formel von Faà di Bruno bekannt.
Hier betrachtet man differenzierbare Funktionen (Abbildungen) <math>f \colon \R^n \to \R^m</math>. Die Ableitung einer solchen Abbildung im Punkt <math>x_0 \in \R^n</math> ist dann eine lineare Abbildung <math>Df_{x_0} \colon \R^n \to \R^m</math>, die durch eine <math>(m \times n)</math>-Matrix, die Jacobi-Matrix <math>J_f(x_0)</math> dargestellt werden kann.
Die Kettenregel besagt, dass die Verkettung von zwei differenzierbaren Abbildungen wieder differenzierbar ist. Ihre Ableitung erhält man, indem man die einzelnen Ableitungen verkettet. Die zugehörige Jacobi-Matrix ist das Matrizenprodukt der einzelnen Jacobi-Matrizen.
Im Detail: Sind die Abbildungen <math>v \colon \R^n \to \R^l</math> im Punkt <math>x_0 \in \R^n</math> und <math>u \colon \R^l \to \R^m</math> im Punkt <math>v(x_0)\in \R^l</math> differenzierbar, so ist auch die Verkettung <math>u \circ v \colon \R^n \to \R^m</math> im Punkt <math>x_0</math> differenzierbar, und es gilt
und
In ähnlicher Form lässt sich eine Kettenregel für Fréchet-Ableitungen von Abbildungen zwischen Banachräumen und für die Ableitungen (Differentiale, Tangentialabbildungen) von Abbildungen zwischen differenzierbaren Mannigfaltigkeiten formulieren.
In vielen Naturwissenschaften wie der Physik sowie in der Ingenieurswissenschaft findet die Kettenregel breite Anwendung. Allerdings hat sich hier eine besondere Notation entwickelt, die von der mathematischen Notation der Kettenregel deutlich abweicht.
In physikalischer Literatur wird für die Ableitung einer Funktion <math>h</math> nach der Variable <math>x</math> in der Regel die Schreibweise
bevorzugt. Ist <math>h</math> eine Verkettung zweier Funktionen: <math>h = f \circ g</math> mit <math>y \mapsto f(y), x \mapsto g(x)</math>, so präsentiert sich die Kettenregel in dieser Notation:
Es ist zusätzlich gängige Konvention, die unabhängige Variable der Funktion <math>f</math> mit dem Funktionsymbol der inneren Funktion <math>g</math> zu identifizieren, dafür aber sämtliche Argumentklammern auszulassen:
Letztlich wird für die Verkettung <math>f \circ g</math> kein neues Symbol eingeführt, sondern die gesamte Verkettung mit der äußeren Funktion <math>f</math> identifiziert: <math>f = f \circ g</math>.
Die Kettenregel nimmt dann das folgende Aussehen an:
Formal stellt sich die Kettenregel hier als eine Erweiterung des "Bruches" <math>\mathrm df/\mathrm dx</math> mit <math>\mathrm dg</math> dar, so dass es in physikalischer Fachliteratur (und auch in anderen Natur- und Ingenieurswissenschaften) gängig ist, die Kettenregel bei Anwendung nicht namentlich zu erwähnen. Stattdessen findet man oft Ersatzformulierungen, so ist etwa von der "Erweiterung von <math>\mathrm df/\mathrm dx</math> mit <math>\mathrm dg</math>" die Rede, teilweise fehlt eine Begründung vollständig. Auch wenn dies für das ungeübte Auge nicht immer auf den ersten Blick erkennbar ist, steckt hinter all diesen Formulierungen ausnahmslos die Kettenregel der Differenzialrechnung.
Obwohl die vorgestellte Notation mit einigen mathematischen Konventionen bricht, erfreut sie sich großer Beliebtheit und weiter Verbreitung, da sie es ermöglicht, mit Ableitungen (zumindest salopp) wie mit "normalen Brüchen" zu rechnen. Viele Rechnungen gestaltet sie außerdem übersichtlicher, da Klammern entfallen und nur sehr wenige Symbole verwendet werden müssen. Vielfach stellt auch die durch eine Verkettung beschriebene Größe eine bestimmte physikalische Variable dar (z.B. eine Energie oder eine elektrische Spannung), für die ein bestimmter Buchstabe "reserviert" ist (etwa E für Energie und U für Spannung). Die obige Notation ermöglicht es, diesen Buchstaben in der gesamten Rechnung durchgängig zu verwenden.
Die kinetische Energie eines Körpers hängt von seiner Geschwindigkeit v ab: <math>E = f(v)</math>. Hängt die Geschwindigkeit wiederum von der Zeit ab, <math>v = g(t)</math>, so ist auch die kinetische Energie des Körpers eine Funktion der Zeit, die durch die Verkettung
beschrieben wird. Möchten wir die Änderung der kinetischen Energie nach der Zeit berechnen, so gilt nach der Kettenregel
In physikalischer Literatur würde man die letzte Gleichung in folgender (oder ähnlicher) Gestalt vorfinden:
Klarer Vorteil ist die durchgängige Verwendung von Funktionssymbolen, deren Buchstaben mit denen der zugrunde liegenden physikalisch relevanten Größe (E für Energie, v für Geschwindigkeit) übereinstimmen.