|
|
Lexikon auf Ihrer Homepage |
|
Lexikon als Lesezeichen hinzufügen |
Mittelwerte (kurz auch nur Mittel, in der Statistik oft auch Durchschnitt statt arithmetisches Mittel) treten in der Mathematik und insbesondere in der Statistik in inhaltlich unterschiedlichen Kontexten auf. Allgemein gilt, dass jedem Mittelwert eine Vorschrift zugrunde liegt, mit der man aus zwei oder mehr Zahlen eine weitere berechnet, die zwischen den gegebenen Zahlen liegt.
In der Statistik wird außerdem oft als Mittelwert der Erwartungswert angedeutet, ein so genannter Lageparameter einer Häufigkeits- oder Wahrscheinlichkeitsverteilung, der die Lage der Elemente einer Stichprobe oder Grundgesamtheit in Bezug auf die Messskala beschreibt.
Im Folgenden seien <math>x_1, \ldots, x_n</math> gegebene reelle Zahlen, in der Statistik etwa Messwerte, deren Mittelwert berechnet werden soll.
| Mittelwert | Definition[1] |
|---|---|
| Modus | Ausprägung mit höchster Häufigkeit |
| Median | Für die sortierten Werte <math>x_{(1)}, \ldots, x_{(n)}</math>
<math>\bar{x}_\mathrm{med} =\begin{cases} x_{(\frac{n+1}{2})}, & n\text{ ungerade,}\\
\frac 12\left(x_{({\frac n2})} + x_{({\frac n2+1})}\right), & n \text{ gerade.}
\end{cases} </math> |
| Arithmetisches Mittel | <math> \bar{x}_{\mathrm{arithm}} = \frac{1}{n} \sum_{i=1}^n{x_i} = \frac{x_1 + x_2 + \dotsb + x_n}{n}</math> |
| Geometrisches Mittel | <math> \bar{x}_\mathrm{geom} = \sqrt[n]{\prod_{i=1}^n{x_i}} = \sqrt[n]{x_1 x_2 \cdots x_n} </math> |
| Harmonisches Mittel | <math> \bar{x}_\mathrm{harm} = \frac{n}{\sum\limits_{i=1}^n \frac{1}{x_i}} = \frac{n}{\frac{1}{x_1} + \frac{1}{x_2} + \dotsb + \frac{1}{x_n}}</math> |
| Quadratisches Mittel | <math> \bar{x}_\mathrm{quadr} = \sqrt{\frac{1}{n}\sum_{i=1}^n{x_i^2}} = \sqrt {{x_1^2 + x_2^2 + \dotsb + x_n^2} \over n}
</math> |
| Kubisches Mittel | <math> \bar{x}_\mathrm{kubisch} = \sqrt[3]{\frac{1}{n}\sum_{i=1}^n{x_i^3}} = \sqrt[3]{\frac{x_1^3 + x_2^3 + \dotsb + x_n^3}{n}}
</math> |
| Merkmalsträger x | Wert |
|---|---|
| <math>x_{(1)}</math> | 2 (A) |
| <math>x_{(2)}</math> | 2 (A) |
| <math>x_{(3)}</math> | 2 (A) |
| <math>x_{(4)}</math> | 3 (B) |
| <math>x_{(5)}</math> | 3 (B) |
| <math>x_{(6)}</math> | 4 (C) |
| <math>x_{(7)}</math> | 5 (D) |
Im Folgenden soll beispielhaft an den sieben rechts angegebenen Ausprägungen gezeigt werden, wo welche Definition des Mittelwerts sinnvoll ist.
Der Modus ist bereits in der Nominalskala sinnvoll, in der einzelne Merkmale nicht geordnet werden können. Sind etwa von sieben befragten Personen drei katholisch (A), zwei evangelisch (B), einer muslimisch (C) und einer Hindu (D), so liegt der Modus bei <math>A</math>, denn dies kommt am häufigsten vor.
Für den Median ist eine Ordinalskala Voraussetzung, in der die Merkmale geordnet werden können. Auf die Frage nach der Qualität des Essens eines Restaurants antworten beispielsweise drei Kunden mit „sehr gut“ (A), zwei mit „gut“ (B) sowie je einer mit „mittel“ und „schlecht“ (C bzw. D). Nach Ordnen der Daten wie in der Liste rechts erkennt man, dass die mittlere Beobachtung bei <math>x_{(4)}</math> liegt. Der Median ist also <math>B</math>.
Das arithmetische Mittel wird beispielsweise zum Berechnen der Durchschnittsgeschwindigkeit genutzt: Läuft eine Schildkröte erst drei Meter pro Stunde, dann drei Stunden lang je zwei Meter und beschleunigt für jeweils eine Stunde nochmals auf drei, vier und fünf Meter pro Stunde, so ergibt sich als arithmetisches Mittel bei einer Strecke von 21 Metern in 7 Stunden:
\bar{x}_{\mathrm{arithm}} & = \frac17 \sum\limits_{i=1}^7 {x_i}\\
& =\frac{(3+2+2+2+3+4+5)\,\mathrm{m}}{7\,\mathrm{h}} = \frac{21\,\mathrm{m}}{7\,\mathrm{h}}=3\,\mathrm{\frac mh}.
\end{align}</math>
Auch das harmonische Mittel kann zur Berechnung einer durchschnittlichen Geschwindigkeit sinnvoll sein, wenn nicht über gleiche Zeiten sondern über gleiche Strecken gemessen wird: Die Schildkröte laufe den 1. Meter mit 3 Metern pro Stunde, weitere 3 m mit jeweils 2 m/h und beschleunigt auf den letzten 3 Metern nochmals auf jeweils 3, 4 und 5 m/h. Die Durchschnittsgeschwindigkeit ergibt sich bei einer Strecke von 7 Metern in <math>\tfrac{157}{60}</math> Stunden:
\bar{x}_{\mathrm{harm}} & =\frac7{\sum\limits_{i=1}^7 \frac1{x_i}}\\
& = \frac{7\,\mathrm m}{(\frac13 + \frac12 + \frac12 + \frac12 + \frac13 + \frac14 + \frac15)\,\mathrm h} =\frac{7\,\mathrm m}{\frac{157}{60}\,\mathrm h} \approx 2{,}68\,\mathrm{\frac mh}.
\end{align}</math>
Mit dem geometrischen Mittel errechnet man den mittleren Wachstumsfaktor. Eine Bakterienkultur wachse beispielsweise am ersten Tag um das Fünffache, am zweiten um das Vierfache, dann zweimal um das Dreifache und die letzten drei Tage verdoppelt sie sich täglich. Der Bestand nach dem siebten Tag errechnet sich also durch <math>\text{Anfangsbestand} \cdot 5 \cdot 4 \cdot 3 \cdot 3 \cdot 2 \cdot 2 \cdot 2 = \text{Endbestand}.</math> Alternativ kann mit dem geometrischen Mittel der Endbestand ermittelt werden, denn
und somit ist
Ein tägliches Wachstum der Bakterienkultur um das 2,83-Fache hätte also nach sieben Tagen zum selben Ergebnis geführt.
In der Mathematik treten Mittelwerte, insbesondere die drei klassischen Mittelwerte (arithmetisches, geometrisches und harmonisches Mittel), bereits in der Antike auf. Pappos von Alexandria kennzeichnet 10 verschiedene Mittelwerte m von 2 Zahlen <math>a</math> und <math>b</math> (<math>a<b</math>) durch spezielle Werte des Streckenverhältnisses <math>(b-m):(m-a)</math>. Auch die Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel ist in der Antike bereits bekannt und geometrisch interpretiert. Im 19. und 20. Jahrhundert spielen Mittelwerte in der Analysis eine spezielle Rolle, dort im Wesentlichen im Zusammenhang mit berühmten Ungleichungen und wichtigen Funktionseigenschaften wie Konvexität (Hölder-Ungleichung, Minkowski-Ungleichung, Jensensche Ungleichung usw.). Dabei wurden die klassischen Mittelwerte in mehreren Schritten verallgemeinert, zunächst zu den Potenzmittelwerten (siehe Abschnitt Hölder-Mittel unten) und diese wiederum zu den quasi-arithmetischen Mittelwerten. Die klassische Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel geht dabei über in allgemeinere Ungleichungen zwischen Potenzmittelwerten bzw. quasi-arithmetischen Mittelwerten.
Die Idee, die den drei klassischen Mittelwerten zugrunde liegt, lässt sich auf folgende Weise allgemein formulieren:
Beim arithmetischen Mittel sucht man die Zahl <math>m</math>, für die
gilt, wobei sich die Summe links über <math>n</math> Summanden erstreckt. Das arithmetische Mittel mittelt also bzgl. der arithmetischen Verknüpfung „Summe“. Anschaulich bestimmt man mit dem arithmetischen Mittel aus Stäben verschiedener Länge einen mit einer durchschnittlichen oder mittleren Länge.
Beim geometrischen Mittel sucht man die Zahl <math>m</math>, für die
gilt, wobei sich das Produkt links über n Faktoren erstreckt. Das geometrische Mittel mittelt also bzgl. der arithmetischen Verknüpfung „Produkt“.
Das harmonische Mittel <math>m</math> löst die Gleichung
Der Kehrwert des harmonischen Mittels ist gleich dem arithmetischen Mittel der Kehrwerte der Zahlen.
Für n=2 hängen die Mittelwerte untereinander in folgender Weise zusammen:
oder nach dem geometrischen Mittel aufgelöst
Die Ungleichung von arithmetischen und geometrischen Mittel vergleicht die Wert des arithmetischen und geometrischen Mittels zweier gegebener Zahlen: Es gilt für positive Variable stets
Die Ungleichung lässt sich auch auf weitere Mittelwerte ausdehnen, z.B. (für positive Variable)
Für zwei (positive) Variable gibt es auch eine grafische Veranschaulichung:
Das geometrische Mittel folgt direkt aus dem euklidischen Höhensatz und das harmonische Mittel aus dem euklidischen Kathetensatz mit der Beziehung
Die gewichteten Mittelwerte entstehen, wenn man den einzelnen Werten unterschiedliche Gewichte, mit denen sie in das Gesamtmittel einfließen, zuordnet; zum Beispiel wenn bei einer Prüfung mündliche und schriftliche Leistung unterschiedlich stark in die Gesamtnote einfließen.
Die genauen Definitionen finden sich hier: gewichtetes arithmetisches Mittel, gewichtetes geometrisches Mittel, gewichtetes harmonisches Mittel
Der logarithmische Mittelwert <math> \bar{x}_{a,b,\ln} </math> zwischen <math>x_a</math> und <math>x_b</math> ist definiert als:
Für <math>x_a\neq x_b </math> liegt der logarithmische Mittelwert zwischen dem geometrischen und dem arithmetischen Mittelwert.
Kann man davon ausgehen, dass die Daten durch „Ausreißer“, das heißt einige wenige zu hohe oder zu niedrige Werte, kontaminiert sind, so kann man die Daten entweder durch Stutzen oder durch „Winsorisieren“ (benannt nach Charles P. Winsor) bereinigen und den gestutzten <math>\bar{x}_{g\alpha}</math> (engl. truncated mean) oder winsorisierten Mittelwert <math>\bar{x}_{w\alpha}</math> (engl. Winsorized mean) berechnen. In beiden Fällen sortiert man die Beobachtungswerte zuerst nach aufsteigender Größe. Beim Stutzen schneidet man sodann eine gleiche Anzahl von Werten am Anfang und am Ende der Folge ab und berechnet von den übrig bleibenden Werten den Mittelwert. Hingegen werden beim „Winsorisieren“ die Ausreißer am Anfang und Ende der Folge durch den nächstgrößeren (bzw. -kleineren) Wert der restlichen Daten ersetzt.
Beispiel: Hat man 10 aufsteigend sortierte, reelle Zahlen <math>x_1, \ldots, x_{10}</math>, so ist das 10%-gestutzte Mittel gleich
Indes ist der 10-%-winsorisierte Mittelwert gleich
D.h. das gestutzte Mittel liegt zwischen dem arithmetischen Mittel (keine Stutzung) und dem Median (maximal Stutzung). Üblicherweise wird ein 20% gestutztes Mittel verwendet, d.h. 40% der Daten bleiben unberücksichtigt für die Mittelwertberechnung. Die Prozentzahl richtet sich im wesentlich nach der Zahl der vermuteten Ausreißer in den Daten; für Bedingungen für eine Stutzung von weniger als 20% sei auf die Literatur verwiesen. [2][3]
Das Quartilsmittel ist definiert als der Mittelwert des 1. und 3. Quartils:
Hierbei bezeichnet <math>\tilde x_{0,25}</math> das 25%-Quantil (1. Quartil) und entsprechend <math>\tilde x_{0,75}</math> das 75%-Quantil (3. Quartil) der Messwerte.
Das Quartilsmittel ist robuster als das arithmetische Mittel, aber weniger robust als der Median.
Das Bereichsmittel ist definiert als der Mittelwert des größten und kleinsten Beobachtungswerts:
oder
Für einen gegebenen reellen Vektor <math>a=(a_1,\dots,a_n)</math> mit <math>\sum_{i=1}^n a_i = 1</math> wird der Ausdruck
wobei über alle Permutationen <math>\sigma</math> von <math>\{ 1, \ldots, n\}</math> summiert wird, als „<math>a</math>-Mittel“ [<math>a</math>] der nichtnegativen reellen Zahlen <math>x_1, \ldots, x_n</math> bezeichnet.
Für den Fall <math>a = (1, 0, \dots,0)</math>, ergibt das genau das arithmetische Mittel der Zahlen <math>x_1, \ldots, x_n</math>; für den Fall <math>a=\left(\tfrac 1 n, \dots, \tfrac 1 n\right)</math> ergibt sich genau das geometrische Mittel.
Für die <math>a</math>-Mittel gilt die Muirhead-Ungleichung.
Beispiel: Sei <math>a=\left(\tfrac 1 2,\tfrac 1 3,\tfrac 1 6\right)</math> und
Damit ergibt sich
{[a]} & = \frac{1}{3!}\left(x_1^{\frac 1 2}x_2^{\frac 1 3}x_3^{\frac 1 6}+x_1^{\frac 1 2}x_3^{\frac 1 3}x_2^{\frac 1 6}+x_2^{\frac 1 2}x_1^{\frac 1 3}x_3^{\frac 1 6}+x_2^{\frac 1 2}x_3^{\frac 1 3}x_1^{\frac 1 6}+x_3^{\frac 1 2}x_1^{\frac 1 3}x_2^{\frac 1 6}+x_3^{\frac 1 2}x_2^{\frac 1 3}x_1^{\frac 1 6}\right)\\
& = \frac 1 6\left(4^{\frac 1 2}{\cdot}5^{\frac 1 3}{\cdot}6^{\frac 1 6}+4^{\frac 1 2}{\cdot}6^{\frac 1 3}{\cdot}5^{\frac 1 6}+5^{\frac 1 2}{\cdot}4^{\frac 1 3}{\cdot}6^{\frac 1 6}+5^{\frac 1 2}{\cdot}6^{\frac 1 3}{\cdot}4^{\frac 1 6}+6^{\frac 1 2}{\cdot}4^{\frac 1 3}{\cdot}5^{\frac 1 6}+6^{\frac 1 2}{\cdot}5^{\frac 1 3}{\cdot}4^{\frac 1 6}\right)\\
& \approx 4{,}94.
\end{align}</math>
Gleitende Durchschnitte werden in der dynamischen Analyse von Messwerten angewandt. Sie sind außerdem ein gängiges Mittel der technischen Analyse in der Finanzmathematik. Mit gleitenden Durchschnitten kann das stochastische Rauschen aus zeitlich voranschreitenden Signalen herausgefiltert werden. Häufig handelt es sich dabei um FIR-Filter. Jedoch muss beachtet werden, dass die meisten gleitenden Durchschnitte dem echten Signal hinterherlaufen. Für vorausschauende Filter siehe z. B. Kalman-Filter.
Gleitende Durchschnitte benötigen normalerweise eine unabhängige Variable, die die Größe der nachlaufenden Stichprobe bezeichnet, bzw. das Gewicht des vorangehenden Wertes für die exponentiellen gleitenden Durchschnitte.
Gängige gleitende Durchschnitte sind:
In der Finanzliteratur können außerdem sogenannte adaptive gleitende Durchschnitte gefunden werden, die sich automatisch einer sich ändernden Umgebung (andere Volatilität/Streuung etc.) anpassen:
Für die Anwendung von gleitenden Durchschnitten siehe auch Gleitende Durchschnitte (Chartanalyse) und MA-Modell.
Sonstige Mittelwerte, die in einem eigenen Artikel beschrieben werden, sind der Modus (eigentlich kein Mittelwert, sondern der häufigste Wert) und der Median, der robust gegenüber extremen Abweichungen, sogenannten Ausreißern, ist.
Außerdem lassen sich Mittelwerte kombinieren; so entsteht etwa das arithmetisch-geometrische Mittel, das zwischen dem arithmetischen und geometrischen Mittel liegt.
Es gibt eine Reihe weiterer Funktionen, mit denen sich die bekannten und weitere Mittelwerte erzeugen lassen.
Für positive Zahlen <math>x_i</math> definiert man den <math>k</math>-Potenzmittelwert, auch Hölder-Mittel (englisch <math>k</math>-th power mean) als
Man beachte, dass sowohl Notation als auch Bezeichnung uneinheitlich sind.
Für <math>k</math> = −1, 0, 1, 2 und 3 ergeben sich daraus etwa das harmonische, das geometrische, das arithmetische, das quadratische und das kubische Mittel.
Außerdem gilt: Je größer <math>k</math> ist, desto größer ist <math>M_k</math>; daraus folgt dann die verallgemeinerte Ungleichung der Mittelwerte
Das Lehmer-Mittel[4] ist ein anderer verallgemeinerter Mittelwert; zur Stufe <math>p</math> ist es definiert durch
Es hat die Spezialfälle
Das Stolarsky-Mittel zweier Zahlen <math>a,c</math> ist definiert durch
Das arithmetische Mittel einer stetigen Funktion <math>f(x)</math> in einem geschlossenen Intervall <math>[a,b]</math> ist
ihr quadratisches
Diese finden in der Technik erhebliche Beachtung, siehe Arithmetischer Mittelwert (Elektrotechnik) und Effektivwert.