|
|
Lexikon auf Ihrer Homepage |
|
Lexikon als Lesezeichen hinzufügen |
Die Normal- oder GauĂ-Verteilung (nach Carl Friedrich GauĂ) ist ein wichtiger Typ stetiger Wahrscheinlichkeitsverteilungen. Ihre Wahrscheinlichkeitsdichte wird auch GauĂ-Funktion, GauĂ-Kurve, GauĂ-Glocke, GauĂsche Glockenkurve oder schlicht Glockenkurve genannt.
Die besondere Bedeutung der Normalverteilung beruht unter anderem auf dem zentralen Grenzwertsatz, der besagt, dass eine Summe von <math> n </math> unabhĂ€ngigen, identisch verteilten Zufallsvariablen mit endlicher Varianz (s. die Cauchy-Verteilung als GegenstĂŒck) im Grenzwert <math>n\rightarrow\infty</math> normalverteilt ist. Das bedeutet, dass man Zufallsvariablen dann als normalverteilt ansehen kann, wenn sie durch Ăberlagerung einer groĂen Zahl von unabhĂ€ngigen EinflĂŒssen entstehen, wobei jede einzelne EinflussgröĂe einen im VerhĂ€ltnis zur Gesamtsumme unbedeutenden Beitrag liefert.
Die Abweichungen der (Mess)Werte vieler natur-, wirtschafts- und ingenieurswissenschaftlicher VorgÀnge vom Mittelwert lassen sich durch die Normalverteilung (bei biologischen Prozessen oft logarithmische Normalverteilung) entweder exakt oder wenigstens in sehr guter NÀherung beschreiben (vor allem Prozesse, die in mehreren Faktoren unabhÀngig voneinander in verschiedene Richtungen wirken).
ZufallsgröĂen mit Normalverteilung benutzt man zur Beschreibung zufĂ€lliger VorgĂ€nge wie:
In der Versicherungsmathematik ist die Normalverteilung geeignet zur Modellierung von Schadensdaten im Bereich mittlerer Schadenshöhen.
In der Messtechnik wird hÀufig eine Normalverteilung angesetzt, die die Streuung der Messfehler beschreibt. Hierbei ist von Bedeutung, wie viele Messpunkte innerhalb einer gewissen Streubreite liegen. Die Standardabweichung <math>\sigma</math> beschreibt die Breite der Normalverteilung und hÀngt mit der Halbwertsbreite zusammen. Es gilt nÀherungsweise:
Und ebenso lassen sich umgekehrt fĂŒr gegebene Wahrscheinlichkeiten die maximalen Abweichungen vom Mittelwert finden:
Somit kann neben dem Mittelwert auch der Standardabweichung eine einfache Bedeutung zugeordnet werden.
Im Jahre 1733 zeigte Abraham de Moivre in seiner Schrift âThe Doctrine of Chancesâ im Zusammenhang mit seinen Arbeiten am Grenzwertsatz fĂŒr Binomialverteilungen eine AbschĂ€tzung des Binomialkoeffizienten, welche als Vorform der Normalverteilung gedeutet werden kann. Die fĂŒr die Normierung der Normalverteilungsdichte zur Wahrscheinlichkeitsdichte notwendige Berechnung des nicht elementaren Integrals
gelang Pierre-Simon Laplace im Jahr 1782 (nach anderen Quellen Poisson). Im Jahr 1809 publizierte GauĂ sein Werk âTheoria motus corporum coelestium in sectionibus conicis solem ambientiumâ (dt.: Theorie der Bewegung der in Kegelschnitten sich um die Sonne bewegenden Himmelskörper), welches neben den eng zusammenhĂ€ngenden Methoden der kleinsten Quadrate und der Maximum-Likelihood-SchĂ€tzung die Normalverteilung definiert. Ebenfalls Laplace war es, der 1810 den Satz vom zentralen Grenzwert bewies, der die Grundlage der theoretischen Bedeutung der Normalverteilung darstellt und de Moivres Arbeit am Grenzwertsatz fĂŒr Binomialverteilungen abschloss. Adolphe QuĂ©telet erkannte schlieĂlich bei Untersuchungen des Brustumfangs von mehreren tausend Soldaten im Jahr 1844 eine verblĂŒffende Ăbereinstimmung mit der Normalverteilung und brachte die Normalverteilung in die angewandte Statistik. Er hat vermutlich die Bezeichnung Normalverteilung geprĂ€gt.
Eine stetige Zufallsvariable <math>X</math> mit der Wahrscheinlichkeitsdichte <math>f\colon\R\to\R</math>, gegeben durch:
heiĂt <math>\mu</math>-<math>\sigma^2</math>-normalverteilt, auch geschrieben als <math>X \sim \mathcal N\left(\mu, \sigma^2\right)</math> oder <math>(\mu,\sigma^2)</math>-normalverteilt, wobei <math>\mu</math> der Erwartungswert und <math>\sigma^2</math> die Varianz sind.
Die Verteilungsfunktion der Normalverteilung ist gegeben durch
Darin ist <math>\Phi</math> die Verteilungsfunktion der Standardnormalverteilung
Die Dichtefunktion der Standardnormalverteilung ist
welche nebenstehend dargestellt ist.
Die mehrdimensionale Verallgemeinerung findet man im Artikel mehrdimensionale Normalverteilung.
Der Graph der Wahrscheinlichkeitsdichte <math>f\colon\R\to\R</math> ist eine gauĂsche Glockenkurve, deren Höhe und Breite von <math> \sigma </math> abhĂ€ngt. Sie ist achsensymmetrisch zur Achse <math> x = \mu </math>. Ihre Stammfunktion <math>F</math> ist punktsymmetrisch relativ zum Punkt <math>(\mu ; 0{,}5)</math>.
Mit Hilfe der ersten und zweiten Ableitung lassen sich der Maximalwert und die Wendepunkte bestimmen. Die erste Ableitung ist
Das Maximum der Dichtefunktion der Normalverteilung liegt demnach bei <math>x_\mathrm{max} = \mu</math> und betrÀgt dort <math>f_\mathrm{max} = \tfrac 1{\sigma\sqrt{2\pi}}.</math>
Die zweite Ableitung lautet
Somit liegen die Wendestellen der Dichtefunktion bei <math>x=\mu\pm\sigma</math>. Die Dichtefunktion hat an den Wendestellen den Wert <math>\tfrac 1{\sigma\sqrt{2\pi e}}</math>.
Wichtig ist, dass die gesamte FlĂ€che unter der Kurve gleich 1 ist, also der Wahrscheinlichkeit eines sicheren Ereignisses entspricht. Somit folgt, dass, wenn zwei gauĂsche Glockenkurven dasselbe <math>\mu</math>, aber unterschiedliche <math>\sigma</math>-Werte haben, jene Kurve mit dem gröĂeren <math>\sigma</math> breiter und niedriger ist (da ja beide zugehörigen FlĂ€chen jeweils den Wert von 1 haben und nur die Standardabweichung (oder âStreuungâ) höher ist). Zwei Glockenkurven mit dem gleichen <math>\sigma</math>, aber unterschiedlichen <math>\mu</math> haben gleich aussehende Graphen, die jedoch auf der <math>x</math>-Achse um die Differenz der <math>\mu</math>-Werte zueinander verschoben sind.
Jede Normalverteilung ist tatsÀchlich normiert, denn mit Hilfe der linearen Substitution
erhalten wir:
FĂŒr die Normiertheit des letzteren Integrals siehe den Artikel Fehlerintegral.
Da sich <math>\Phi(z)</math> nicht auf eine elementare Stammfunktion zurĂŒckfĂŒhren lĂ€sst, wurde fĂŒr die Berechnung frĂŒher meist auf Tabellen zurĂŒckgegriffen (siehe Tabelle der Standardnormalverteilung). Heutzutage sind in ĂŒblichen Tabellenkalkulationsprogrammen Zellenfunktionen verfĂŒgbar, die einem auch die Transformation auf beliebige <math> \mu </math> und <math> \sigma </math> abnehmen. Die dahinter liegenden NĂ€herungen sind transformierte Polynome.[2]
Der Erwartungswert der Standardnormalverteilung ist 0. Es sei <math>X \sim \mathcal N\left(0,1\right)</math>, so gilt
da der Integrand integrierbar ist und punktsymmetrisch.
Ist nun <math>Y \sim \mathcal N\left(\mu, \sigma^2\right)</math>, so gilt <math>X=(Y-\mu)/\sigma</math> sei standardnormalverteilt, und somit
Die Varianz der <math>\mu</math>-<math>\sigma^2</math>-normalverteilten ZufallsgröĂe ist tatsĂ€chlich <math>\sigma^2</math>, ein elementarer Beweis wird Poisson zugeschrieben.
Die mittlere absolute Abweichung ist <math> \sqrt{2/\pi}\sigma \approx 0{,}80\sigma</math> und der Interquartilsabstand <math>\approx 1{,}349\sigma</math>.
Aus Erwartungswert <math>\mu</math> und Standardabweichung <math>\sigma</math> der <math>\mathcal N(\mu,\sigma^2)</math>-Verteilung erhÀlt man unmittelbar den Variationskoeffizienten
Die Schiefe besitzt unabhÀngig von den Parametern <math>\mu</math> und <math>\sigma</math> immer den Wert 0.
Die charakteristische Funktion fĂŒr eine standardnormalverteilte Zufallsvariable <math>Z</math> berechnet sich gemĂ€Ă
\varphi_Z(s) &= \operatorname E(e^{isZ})\\
&= \frac 1{\sqrt{2\pi}}\int\limits_{-\infty}^\infty e^{isz} e^{-\frac 12 z^2} \mathrm dz\\
&= \frac 1{\sqrt{2\pi}}\int\limits_{-\infty}^\infty e^{-\frac 12 (z-is)^2} e^{-\frac 12 s^2} \mathrm dz\\
&= \frac 1{\sqrt{2\pi}}e^{-\frac 12 s^2} \int\limits_{-\infty}^\infty e^{-\frac 12 z^2} \mathrm dz\\
&= e^{-\frac 12 s^2}.
\end{align} </math> Den Ăbergang von der dritten zur vierten Zeile erhĂ€lt man dabei durch Anwendung des Cauchyschen Integralsatzes.
FĂŒr eine Zufallsvariable <math>X \sim \mathcal N(\mu, \sigma^2)</math> erhĂ€lt man nun
\varphi_X(s) &= \operatorname E(e^{is(\sigma Z + \mu)})\\
&= \operatorname E(e^{is\sigma Z}e^{is\mu})\\
&= e^{is\mu}\operatorname E(e^{is\sigma Z})\\
&= e^{is\mu}\varphi_Z(\sigma s)\\
&= \exp\left(is\mu-\tfrac 12 \sigma^2 s^2\right),
\end{align}</math> wobei <math>Z \sim \mathcal N(0,1)</math>.
Die momenterzeugende Funktion der Normalverteilung ist
Sei <math>X</math> <math>N(\mu,\sigma^2)</math>-verteilt. Dann sind die ersten Momente wie folgt:
| Nummer, <math>k</math> | Moment, <math>\operatorname E(X^k)</math> | zentriertes Moment | Kumulante |
|---|---|---|---|
| 0 | 1 | 1 | |
| 1 | <math>\mu</math> | 0 | <math>\mu</math> |
| 2 | <math>\mu^2 + \sigma^2</math> | <math>\sigma^2</math> | <math>\sigma^2</math> |
| 3 | <math>\mu^3 + 3\mu\sigma^2</math> | 0 | 0 |
| 4 | <math>\mu^4 + 6 \mu^2 \sigma^2 + 3 \sigma^4</math> | <math>3 \sigma^4</math> | 0 |
| 5 | <math>\mu^5 + 10 \mu^3 \sigma^2 + 15 \mu \sigma^4</math> | 0 | 0 |
| 6 | <math>\mu^6 + 15 \mu^4 \sigma^2 + 45 \mu^2 \sigma^4 + 15 \sigma^6 </math> | <math> 15 \sigma^6 </math> | 0 |
| 7 | <math>\mu^7 + 21 \mu^5 \sigma^2 + 105 \mu^3 \sigma^4 + 105 \mu \sigma^6 </math> | 0 | 0 |
| 8 | <math>\mu^8 + 28 \mu^6 \sigma^2 + 210 \mu^4 \sigma^4 + 420 \mu^2 \sigma^6 + 105 \sigma^8 </math> | <math> 105 \sigma^8 </math> | 0 |
Alle zentralen Momente <math>\mu_n</math> lassen sich durch die Standardabweichung <math>\sigma</math> darstellen:
0 & \text{wenn }n\text{ ungerade}\\ \sigma^{n}\,(n-1)!! & \text{wenn }n\text{ gerade}\end{cases}</math>
dabei wurde die DoppelfakultÀt verwendet:
Die Normalverteilung ist invariant gegenĂŒber der Faltung, d. h. die Summe unabhĂ€ngiger normalverteilter ZufallsgröĂen ist wieder normalverteilt. Eine veranschaulichende Formulierung dieses Sachverhaltes lautet: Die Faltung einer GauĂkurve der Halbwertsbreite <math>\Gamma_a</math> mit einer GauĂkurve der Halbwertsbreite <math>\Gamma_b</math> ergibt wieder eine GauĂkurve mit der Halbwertsbreite
Sind also <math>X, Y</math> zwei unabhÀngige Zufallsvariable mit
so ist deren Summe ebenfalls normalverteilt:
Das lÀsst sich dadurch beweisen, dass die charakteristische Funktion der Summe das Produkt der charakteristischen Funktionen der Summanden ist.
Speziell ist das arithmetische Mittel <math>n</math> unabhĂ€ngiger und normalverteilter ZufallsgröĂen <math>X_i \sim \mathcal N(\mu_i, \sigma_i^2)</math> wieder eine normalverteilte ZufallsgröĂe mit
Nach dem Satz von CramĂ©r gilt sogar die Umkehrung: Ist eine normalverteilte ZufallsgröĂe die Summe von unabhĂ€ngigen ZufallsgröĂen, dann sind die Summanden ebenfalls normalverteilt.
Die Dichtefunktion der Normalverteilung ist ein Fixpunkt der Fourier-Transformation, d. h. die Fourier-Transformierte einer GauĂkurve ist wieder eine GauĂkurve. Das Produkt der Standardabweichungen dieser korrespondierenden GauĂkurven ist konstant; es gilt die heisenbergsche UnschĂ€rferelation.
Die Normalverteilung hat die Entropie: <math>\log\left(\sigma\sqrt{2\,\pi\,e}\right)</math>.
Da sie fĂŒr gegebenen Mittelwert und gegebene Varianz die gröĂte Entropie unter allen Verteilungen hat, wird sie in der Maximum-Entropie-Methode oft als A-priori-Wahrscheinlichkeit verwendet.
Eine Normalverteilung mit beliebigen <math> \mu </math> und <math> \sigma </math> und der Verteilungsfunktion F hat, wie oben erwÀhnt, die nachfolgende Beziehung zur <math>\mathcal{N}(0,1)</math>-Verteilung:
F(x) = \Phi \left(\tfrac{x-\mu}{\sigma}\right). </math>
Darin ist <math>\Phi</math> die Verteilungsfunktion der Standardnormalverteilung.
Wenn <math>X\sim \mathcal{N}(\mu,\sigma^2)</math>, dann fĂŒhrt die Transformation
zu einer standardnormalverteilten Zufallsvariablen Z, denn
Geometrisch betrachtet entspricht die durchgefĂŒhrte Substitution einer flĂ€chentreuen Transformation der Glockenkurve von <math> \mathcal{N}(\mu;\sigma^2) </math> zur Glockenkurve von <math> \mathcal{N}(0;1) </math>.
Die Normalverteilung kann zur Approximation der Binomialverteilung verwendet werden, wenn der Stichprobenumfang <math>n</math> hinreichend groĂ und in der Grundgesamtheit der Anteil <math>p</math> der gesuchten Eigenschaft nicht zu klein ist. Als Faustregeln dafĂŒr gelten: <math>np(1-p)\geq 9</math>, was fĂŒr die Standardabweichung bedeutet: <math>\sigma\geq 3</math>
Falls diese Bedingung nicht erfĂŒllt sein sollte, ist die NĂ€herung immer noch vertretbar genau, wenn gilt: <math>np\geq 4</math> und zugleich <math>n(1-p)\geq 4</math>.
Ist eine Binomialverteilung (Bernoulli-Versuch) mit <math> n </math> voneinander unabhĂ€ngigen Stufen (bzw. Zufallsversuchen) mit einer Erfolgswahrscheinlichkeit <math> p </math> gegeben, so lĂ€sst sich die Wahrscheinlichkeit fĂŒr <math>k</math> Erfolge allgemein durch <math> P(X=k)= \tbinom{n}{k} \cdot p^k\cdot (1-p)^{n-k} </math> fĂŒr <math> k=0,1,\dots,n </math> berechnen.
FĂŒr sehr groĂe Werte von <math> n </math> kann diese Binomialverteilung durch eine Normalverteilung approximiert werden (Satz von Moivre-Laplace, zentraler Grenzwertsatz). Dabei ist
Ist nun <math>\sigma > 3</math>, dann ist folgende NĂ€herung brauchbar:
P(x_1 \leq X \leq x_2) &= \underbrace{\sum_{k=x_1}^{x_2} {n \choose k} \cdot p^k\cdot (1-p)^{n-k}}_{\mathrm{BV}}\\
&\approx \underbrace{\Phi\left(\frac{x_2+0,5-\mu}{\sigma}\right) -\Phi\left(\frac{x_1-0,5-\mu}{\sigma}\right)}_{\mathrm{NV}}.
\end{align}</math>
Bei der Normalverteilung wird die untere Grenze um 0,5 verkleinert und die obere Grenze um 0,5 vergröĂert, um eine bessere Approximation bei einer geringen Standardabweichung <math> \sigma </math> gewĂ€hrleisten zu können. Dies nennt man auch Stetigkeitskorrektur. Nur wenn <math> \sigma </math> einen sehr hohen Wert besitzt, kann auf sie verzichtet werden.
Da die Binomialverteilung diskret ist, muss auf einige Punkte geachtet werden:
Der groĂe Vorteil der Approximation liegt darin, dass sehr viele Stufen einer Binomialverteilung sehr schnell und einfach bestimmt werden können.
Der Quotient von zwei unabhÀngigen <math>\mathcal{N}(0,1)</math> standardnormalverteilten Zufallsvariablen ist Cauchy-verteilt.
Der Betrag <math> Z = \sqrt{X^2 + Y^2} </math> zweier normalverteilter Zufallsvariablen <math>X, Y </math> ist Rayleigh-verteilt.
Ist die Zufallsvariable <math>X</math> normalverteilt mit <math>\mathcal{N}(\mu,\sigma^{2})</math>, dann ist die Zufallsvariable <math>Y=e^{X}</math> logarithmisch-normalverteilt mit <math>\mathcal{LN}(\mu,\sigma^{2})</math>.
Die Entstehung einer logarithmischen Normalverteilung ist auf multiplikatives, die einer Normalverteilung auf additives Zusammenwirken vieler ZufallsgröĂen zurĂŒckfĂŒhren.
Wenn die identischen normalverteilten Zufallsvariablen <math>X_1^{(1)}, X_2^{(1)}, \dots , X_n^{(1)}</math> und <math>X_1^{(2)}, X_2^{(2)}, \dots , X_n^{(2)}</math> die Parameter
mit <math>\sigma_{1}=\sigma_{2}=\sigma</math> besitzen, dann unterliegt die Zufallsvariable
{(n_{1}-1)\sum\limits_{j=1}^{n_{2}}(X_{i}^{(2)}-\bar
^{(2)})^{2}}</math>
einer F-Verteilung mit <math>((n_{1}-1,n_{2}-1))</math> Freiheitsgraden. Dabei sind
\bar{X}^{(2)}=\frac{1}{n_{2}}\sum_{i=1}^{n_{2}}X_{i}^{(2)}.</math>
Wenn die unabhĂ€ngigen Zufallsvariablen <math>X_1, X_2, \dots , X_n</math> identisch normalverteilt sind mit den Parametern <math>\mu</math> und <math>\sigma</math>, dann unterliegt die stetige ZufallsgröĂe
einer Studentschen t-Verteilung mit <math>(n-1)</math> Freiheitsgraden.
FĂŒr eine steigende Anzahl an Freiheitsgraden nĂ€hert sich die Student-t-Verteilung der Normalverteilung immer nĂ€her an. Als Faustregel gilt, dass man ab ca. <math>df > 30</math> die Student-t-Verteilung bei Bedarf durch die Normalverteilung approximieren kann.
Die Student-t-Verteilung wird zur KonfidenzschĂ€tzung fĂŒr den Erwartungswert einer normalverteilten Zufallsvariable bei unbekannter Varianz verwendet.
Bei Aufgabenstellungen, bei denen die Wahrscheinlichkeit fĂŒr <math> {\mu}-{\sigma^2}</math>-normalverteilte Zufallsvariablen durch die Standardnormalverteilung ermittelt werden soll, ist es nicht nötig, die oben angegebene Transformation jedes Mal durchzurechnen. Stattdessen wird einfach die Transformation
verwendet, um eine <math> \mathcal{N}(0;1) </math>-Verteilte Zufallsvariable Z zu erzeugen.
Die Wahrscheinlichkeit fĂŒr das Ereignis, dass z. B. X im Interval <math> [x,y]</math> liegt, ist durch folgende Umrechnung gleich einer Wahrscheinlichkeit der Standardnormalverteilung:
\begin{align}
P(x \leq X \leq y) &= P\left(\frac {x-\mu}{\sigma} \leq \frac {X-\mu}{\sigma} \leq \frac {y-\mu}{\sigma}\right)\\
&=P\left(\frac {x-\mu}{\sigma} \leq Z \leq \frac {y-\mu}{\sigma}\right)\\
&=\Phi\left(\frac {y-\mu}{\sigma}\right)-\Phi\left(\frac {x-\mu}{\sigma}\right)
\end{align} </math>
Allgemein gibt die Verteilungsfunktion die FlÀche unter der Glockenkurve bis zum Wert <math>x</math> an, d. h. es wird das bestimmte Integral von <math>-\infty</math> bis <math>x</math> berechnet.
Dies entspricht in Aufgabenstellungen einer gesuchten Wahrscheinlichkeit, bei der die Zufallsvariable <math>X</math> kleiner oder kleiner gleich einer bestimmten Zahl <math>x</math> ist. Durch die Verwendung der reellen Zahlen und der Stetigkeit der Normalverteilung macht es keinen Unterschied, ob nun <math> < </math> oder <math>\leq</math> verlangt ist,
Dasselbe gilt fĂŒr gröĂer und gröĂer gleich.
Dadurch, dass <math>X</math> nur kleiner oder gröĂer einer Grenze (oder innerhalb oder auĂerhalb zweier Grenzen) liegen kann, ergeben sich fĂŒr Aufgaben bei normalverteilten Wahrscheinlichkeitsberechnungen folgende zwei grundlegende Fragestellungen:
(Da jede Zufallsvariable <math> X </math> der allgemeinen Normalverteilung sich in die ZufallsgröĂe <math> Z </math> der Standardnormalverteilung umwandeln lĂ€sst, gelten die Fragestellungen fĂŒr beide GröĂen gleichbedeutend.)
Der Streubereich gibt die Wahrscheinlichkeit wieder, dass die normalverteilte Zufallsvariable <math>Z</math> Werte zwischen <math>z_1</math> und <math>z_2</math> annimmt:
Beim Sonderfall des symmetrischen Streubereiches (<math>z_1=-z_2</math>, mit <math>z_2>0</math>) gilt
P(-z\le Z\le z ) &= P (|Z|\le z)\\
&= \Phi(z)-\Phi(-z)\\
&= \Phi(z)-(1-\Phi(z))\\
&= 2\Phi(z)-1.
\end{align}</math>
Hingegen gibt der Antistreubereich die Höhe der Wahrscheinlichkeit an, dass die normalverteilte Zufallsvariable <math>Z</math> Werte auĂerhalb des Bereichs zwischen <math>z_1</math> und <math>z_2</math> annimmt:
Somit folgt bei einem symmetrischen Antistreubereich
P(Z\le -z\text{ oder }Z\ge z) &= P(|Z|\ge z)\\
&=\Phi(-z)+1-\Phi(z)\\
&= 1-\Phi(z)+1-\Phi(z)\\
&=2-2 \Phi(z).
\end{align}</math>
Besondere Bedeutung haben beide Streubereiche z. B. bei der QualitĂ€tssicherung von technischen oder wirtschaftlichen Produktionsprozessen. Hier gibt es einzuhaltende Toleranzgrenzen <math> x_1 </math> und <math> x_2 </math> , wobei es meist einen gröĂten noch akzeptablen Abstand <math> \epsilon </math> vom Erwartungswert <math> \mu </math> (= dem optimalen Sollwert) gibt. <math> \sigma </math> kann hingegen empirisch aus dem Produktionsprozess gewonnen werden.
Wurde <math> [x_1;x_2]=[\mu-\epsilon;\mu+\epsilon] </math> als einzuhaltendes Toleranzintervall angegeben, so liegt (je nach Fragestellung) ein symmetrischer Streu- oder Antistreubereich vor.
Im Falle des Streubereiches gilt:
P(x_1 \leq X \leq x_2) &= P(|X-\mu|\leq\epsilon)\\
&= P(\mu-\epsilon \leq X \leq \mu+\epsilon)\\
&= P\left(\frac{-\epsilon}{\sigma} \leq Z \leq \frac{\epsilon}{\sigma}\right)\\
&= \Phi\left(\frac{\epsilon}{\sigma}\right)-\Phi\left(\frac{-\epsilon}{\sigma}\right)\\
&= 2 \Phi\left(\frac{\epsilon}{\sigma}\right)-1\\
&= \gamma.
\end{align}</math>
Der Antistreubereich ergibt sich dann aus
oder wenn kein Streubereich berechnet wurde durch
Das Ergebnis <math> \gamma </math> ist also die Wahrscheinlichkeit fĂŒr verkaufbare Produkte, wĂ€hrend <math> \alpha </math> die Wahrscheinlichkeit fĂŒr Ausschuss bedeutet, wobei beides von den Vorgaben von <math> \mu </math>, <math> \sigma </math> und <math> \epsilon </math> abhĂ€ngig ist.
Ist bekannt, dass die maximale Abweichung <math> \epsilon </math> symmetrisch um den Erwartungswert liegt, so sind auch Fragestellungen möglich, bei denen die Wahrscheinlichkeit vorgegeben und eine der anderen GröĂen zu berechnen ist.
Um zu ĂŒberprĂŒfen, ob vorliegende Daten normalverteilt sind, können folgende Methoden angewandt werden:
Die Tests haben unterschiedliche Eigenschaften hinsichtlich der Art der Abweichungen von der Normalverteilung, die sie erkennen. So erkennt der Kolmogorov-Smirnov-Test Abweichungen in der Mitte der Verteilung eher als Abweichungen an den RĂ€ndern, wĂ€hrend der Jarque-Bera-Test ziemlich sensibel auf stark abweichende Einzelwerte an den RĂ€ndern (âheavy tailsâ) reagiert.
Beim Lilliefors-Test muss im Gegensatz zum Kolomogorov-Smirnov-Test nicht standardisiert werden, d. h. <math>\mu</math> und <math>\sigma</math> der angenommenen Normalverteilung dĂŒrfen unbekannt sein.
Mit Hilfe von Quantil-Quantil-Plots (auch Normal-Quantil-Plots oder kurz Q-Q-Plot) ist eine einfache grafische ĂberprĂŒfung auf Normalverteilung möglich.
Mit der Maximum-Likelihood-Methode können die Parameter <math>\mu</math> und <math>\sigma</math> der Normalverteilung geschÀtzt und die empirischen Daten mit der angepassten Normalverteilung grafisch verglichen werden.
Oft sind die Parameter einer Normalverteilung nicht bekannt und mĂŒssen geschĂ€tzt werden. Beispielsweise ist dies der Fall, wenn eine Reihe von Messwerten <math>x_1, \dots, x_n</math> vorliegt, bei welcher man Grund zur Annahme hat, dass sie unabhĂ€ngige Realisierungen einer normalverteilen ZufallsgröĂe mit unbekannten Parametern <math>\mu</math> und <math>\sigma^2</math> sind.
Der Erwartungswert <math>\mu</math> kann durch das arithmetische Mittel
geschĂ€tzt werden (siehe SchĂ€tzwert fĂŒr den Erwartungswert).
Die Varianz <math>\sigma^2</math> kann ĂŒber die (korrigierte) Stichprobenvarianz
geschÀtzt werden.
Beide SchÀtzer sind erwartungstreu.
Um die Parameter einer Normalverteilung zu schĂ€tzen, kann man auch die Maximum-Likelihood-SchĂ€tzung verwenden. SchĂ€tzer <math>\hat\mu_{ML}</math> fĂŒr den Erwartungswert und <math>\hat\sigma^2_{ML}</math> fĂŒr die Varianz erhĂ€lt man, indem die Log-Likelihood-Funktion fĂŒr die Normalverteilung maximiert wird[3].
Als Maximum-Likelihood-SchĂ€tzer fĂŒr <math>\mu</math> ergibt damit ebenfalls <math>\hat\mu_{ML} = \bar{x}</math>, also das arithmetische Mittel der Messwerte.
FĂŒr die Varianz erhĂ€lt man dagegen die unkorrigierte Stichprobenvarianz
\hat{\sigma}^2_{ML} = \frac{n-1}{n}s^2 = \frac{1}{n} \sum_{i=1}^n {(x_i - \bar{x})^2} </math>
und fĂŒr die Standardabweichung
\hat{\sigma}_{ML} = \sqrt{\hat{\sigma}^2_{ML}} = \sqrt{ \frac{1}{n} \sum_{i=1}^n {(x_i - \bar{x})^2} }. </math>
Diese SchĂ€tzer fĂŒr Varianz bzw. Standardabweichung sind jedoch nicht bzw. nur asymptotisch erwartungstreu. Selbst wenn man einen erwartungstreuen Varianz-SchĂ€tzer verwendet, ist dessen Quadratwurzel â d. h. die Standardabweichung â im Allgemeinen nicht ebenfalls erwartungstreu.[4]
Nach der Box-Muller-Methode lassen sich zwei unabhÀngige, standardnormalverteilte Zufallsvariablen <math>X</math> und <math>Y</math> aus zwei unabhÀngigen, gleichverteilten Zufallsvariablen <math>U_1,U_2 \sim U(0,1)</math>, sogenannten Standardzufallszahlen, simulieren:
und
Die Polar-Methode von Marsaglia ist auf einem Computer noch schneller, da sie nur einen Logarithmus benutzt:
Durch lineare Transformation lassen sich hieraus beliebige normalverteilte Zufallszahlen erzeugen: Ist die Zufallsvariable <math>x \sim \mathcal{N}(0,1)</math>-verteilt, so ist <math>a \cdot x + b</math> schlieĂlich <math>\mathcal{N}(b,a^2)</math>-verteilt.
Der zentrale Grenzwertsatz besagt, dass sich unter bestimmten Voraussetzungen die Verteilung der Summe unabhÀngiger, identisch verteilter Zufallszahlen einer Normalverteilung nÀhert.
Ein Spezialfall ist die Zwölferregel, die sich auf die Summe von zwölf Zufallszahlen aus einer Gleichverteilung auf dem Intervall [0,1] beschrĂ€nkt und bereits zu passablen Verteilungen fĂŒhrt.
Stark ins Gewicht fĂ€llt die Forderung der UnabhĂ€ngigkeit der zwölf Zufallsvariablen <math>X_i</math>, die bei immer noch hĂ€ufig verwendeten (Linearen Kongruenzgeneratoren (LKG)) nicht garantiert ist. Im Gegenteil wird vom Spektraltest fĂŒr LKG meist nur die UnabhĂ€ngigkeit von maximal vier bis sieben der <math>X_i</math> garantiert. FĂŒr numerische Simulationen ist die Zwölferregel daher sehr bedenklich und sollte, wenn ĂŒberhaupt, dann ausschlieĂlich mit aufwĂ€ndigeren, aber besseren Pseudo-Zufallsgeneratoren wie z. B. dem Mersenne Twister (Standard in Python, GNU R) oder WELL durchgefĂŒhrt werden. Andere, sogar leichter zu programmierende Verfahren, sind daher i. d. R. der Zwölferregel vorzuziehen.
Normalverteilungen lassen sich mit der Verwerfungsmethode (s. dort) simulieren.
Die Normalverteilung lĂ€sst sich auch mit der Inversionsmethode berechnen. Da das Fehlerintegral leider nicht explizit mit elementaren Funktionen integrierbar ist, muss man auf Reihenentwicklungen der inversen Funktion fĂŒr einen Startwert (<math>a_1 ... a_{14}</math> weiter unten) und anschlieĂende Korrektur mit dem Newtonverfahren zurĂŒckgreifen. Dazu werden erf(x) und erfc(x) benötigt, die ihrerseits mit Reihenentwicklungen und Kettenbruchentwicklungen berechnet werden können â insgesamt ein relativ hoher Aufwand. Die notwendigen Entwicklungen sind in der Literatur zu finden.[5]
Entwicklung des inversen Fehlerintegrals (wegen des Pols nur als Startwert fĂŒr das Newtonverfahren verwendbar):
mit den Koeffizienten
a_i &= 1,
\tfrac 13,
\tfrac 7{30},
\tfrac {127}{630},
\tfrac {4369}{22680},
\tfrac {34807}{178200},
\tfrac {20036983}{97297200},
\tfrac {2280356863}{10216206000},
\tfrac {49020204823}{198486288000},\\
&\\
& \tfrac {65967241200001}{237588086736000},
\tfrac {15773461423793767}{49893498214560000},
\tfrac {655889589032992201}{1803293578326240000},\\
&\\
& \tfrac {94020690191035873697}{222759794969712000000},
\tfrac {655782249799531714375489}{1329207696584271504000000},\ldots
\end{align}</math>
Die Normalverteilung lĂ€sst sich auch zur Beschreibung nicht direkt stochastischer Sachverhalte verwenden, etwa in der Physik fĂŒr das Amplitudenprofil der GauĂ-Strahlen und andere Verteilungsprofile.
Zudem findet sie Verwendung in der Gabor-Transformation.
Diskrete univariate Verteilungen fĂŒr endliche Mengen:
Benford |
Bernoulli |
beta-binomial |
binomial |
kategorial |
hypergeometrisch |
Rademacher |
Zipf |
Zipf-Mandelbrot
Diskrete univariate Verteilungen fĂŒr unendliche Mengen:
Boltzmann |
Conway-Maxwell-Poisson |
negativ binomial |
erweitert negativ binomial |
Compound-Poisson |
diskret uniform |
discrete-Phase-Type |
Gauss-Kuzmin |
geometrisch |
logarithmisch |
parabolisch-fraktal |
Poisson |
Poisson-Gamma |
Skellam |
Yule-Simon |
Zeta
Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta |
Cantor |
Kumaraswamy |
raised Cosine |
Dreieck |
U-quadratisch |
stetig uniform |
Wigner-Halbkreis
Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime |
Bose-Einstein |
Burr |
Chi-Quadrat |
Coxian |
Erlang |
Exponential |
F |
Fermi-Dirac |
Folded normal |
Fréchet |
Gamma |
Gamma-Gamma |
Extremwert |
verallgemeinert invers GauĂ |
halblogistisch |
halbnormal |
Hotellings T-Quadrat |
hyper-exponentiale |
hypoexponential |
invers Chi-Quadrat |
scale-invers Chi-Quadrat |
Invers Normal |
Invers Gamma |
Lévy |
log-normal |
log-logistisch |
Maxwell-Boltzmann |
Maxwell-Speed |
Nakagami |
nichtzentriert Chi-Quadrat |
Pareto |
Phase-Type |
Rayleigh |
relativistisch Breit-Wigner |
Rice |
Rosin-Rammler |
shifted Gompertz |
truncated normal |
Type-2-Gumbel |
Weibull |
Wilksâ Lambda
Kontinuierliche univariate Verteilungen mit unbeschrÀnktem Intervall:
Cauchy |
Extremwert |
exponential Power |
Fishers z |
Fisher-Tippett (Gumbel) |
generalized hyperbolic |
Hyperbolic-secant |
Landau |
Laplace |
alpha-stabil |
logistisch |
normal (GauĂ) |
normal-invers GauĂâsch |
Skew-normal |
Studentsche t |
Type-1-Gumbel |
Variance-Gamma |
Voigt
Diskrete multivariate Verteilungen:
Ewen |
multinomial |
Dirichlet compound multinomial
Kontinuierliche multivariate Verteilungen:
Dirichlet |
generalized Dirichlet |
multivariat normal |
multivariat Student |
normalskaliert invers Gamma |
Normal-Gamma
Multivariate Matrixverteilungen:
Invers Wishart |
Matrix-normal |
Wishart