Kontinuierliche statistische Verteilungen#
Überblick#
Alle Verteilungen haben Lage- (L) und Skalierungsparameter (S) sowie alle benötigten Formparameter. Die Namen der Formparameter variieren. Die Standardform der Verteilungen wird angegeben, wobei \(L=0.0\) und \(S=1.0.\) Die nichtstandardmäßigen Formen können für die verschiedenen Funktionen unter Verwendung von (beachten Sie, dass \(U\) eine standardmäßige uniforme Zufallsvariable ist) erhalten werden.
Funktionsname |
Standardfunktion |
Transformation |
|---|---|---|
Kumulative Verteilungsfunktion (CDF) |
\(F\left(x\right)\) |
\(F\left(x;L,S\right)=F\left(\frac{\left(x-L\right)}{S}\right)\) |
Wahrscheinlichkeitsdichtefunktion (PDF) |
\(f\left(x\right)=F^{\prime}\left(x\right)\) |
\(f\left(x;L,S\right)=\frac{1}{S}f\left(\frac{\left(x-L\right)}{S}\right)\) |
Perzentil-Punkt-Funktion (PPF) |
\(G\left(q\right)=F^{-1}\left(q\right)\) |
\(G\left(q;L,S\right)=L+SG\left(q\right)\) |
Wahrscheinlichkeits-Sparsity-Funktion (PSF) |
\(g\left(q\right)=G^{\prime}\left(q\right)\) |
\(g\left(q;L,S\right)=Sg\left(q\right)\) |
Gefährdungsfunktion (HF) |
\(h_{a}\left(x\right)=\frac{f\left(x\right)}{1-F\left(x\right)}\) |
\(h_{a}\left(x;L,S\right)=\frac{1}{S}h_{a}\left(\frac{\left(x-L\right)}{S}\right)\) |
Kumulative Gefährdungsfunktion (CHF) |
\(H_{a}\left(x\right)=\) \(\log\frac{1}{1-F\left(x\right)}\) |
\(H_{a}\left(x;L,S\right)=H_{a}\left(\frac{\left(x-L\right)}{S}\right)\) |
Überlebensfunktion (SF) |
\(S\left(x\right)=1-F\left(x\right)\) |
\(S\left(x;L,S\right)=S\left(\frac{\left(x-L\right)}{S}\right)\) |
Inverse Überlebensfunktion (ISF) |
\(Z\left(\alpha\right)=S^{-1}\left(\alpha\right)=G\left(1-\alpha\right)\) |
\(Z\left(\alpha;L,S\right)=L+SZ\left(\alpha\right)\) |
Momentenerzeugende Funktion (MGF) |
\(M_{Y}\left(t\right)=E\left[e^{Yt}\right]\) |
\(M_{X}\left(t\right)=e^{Lt}M_{Y}\left(St\right)\) |
Zufallsvariablen |
\(Y=G\left(U\right)\) |
\(X=L+SY\) |
(Differentiale) Entropie |
\(h\left[Y\right]=-\int f\left(y\right)\log f\left(y\right)dy\) |
\(h\left[X\right]=h\left[Y\right]+\log S\) |
(Nichtzentrale) Momente |
\(\mu_{n}^{\prime}=E\left[Y^{n}\right]\) |
\(E\left[X^{n}\right]=L^{n}\sum_{k=0}^{N}\left(\begin{array}{c} n\\ k\end{array}\right)\left(\frac{S}{L}\right)^{k}\mu_{k}^{\prime}\) |
Zentrale Momente |
\(\mu_{n}=E\left[\left(Y-\mu\right)^{n}\right]\) |
\(E\left[\left(X-\mu_{X}\right)^{n}\right]=S^{n}\mu_{n}\) |
Mittelwert (Modus, Median), Varianz |
\(\mu,\,\mu_{2}\) |
\(L+S\mu,\, S^{2}\mu_{2}\) |
Schiefe |
\(\gamma_{1}=\frac{\mu_{3}}{\left(\mu_{2}\right)^{3/2}}\) |
\(\gamma_{1}\) |
Kurtosis |
\(\gamma_{2}=\frac{\mu_{4}}{\left(\mu_{2}\right)^{2}}-3\) |
\(\gamma_{2}\) |
Momente#
Nichtzentrale Momente werden mit der PDF definiert
Beachten Sie, dass diese immer mit der PPF berechnet werden können. Setzen Sie \(x=G\left(q\right)\) in die obige Gleichung ein und erhalten Sie
was numerisch einfacher zu berechnen sein kann. Beachten Sie, dass \(q=F\left(x\right)\) sodass \(dq=f\left(x\right)dx.\) Zentrale Momente werden ähnlich berechnet \(\mu=\mu_{1}^{\prime}\)
Insbesondere
Schiefe ist definiert als
während (Fisher) Kurtosis
so dass eine Normalverteilung eine Kurtosis von Null hat.
Median und Modus#
Der Median, \(m_{n}\), ist definiert als der Punkt, an dem die Hälfte der Dichte auf einer Seite und die Hälfte auf der anderen Seite liegt. Mit anderen Worten, \(F\left(m_{n}\right)=\frac{1}{2}\), sodass
Zusätzlich ist der Modus, \(m_{d}\), definiert als der Wert, für den die Wahrscheinlichkeitsdichtefunktion ihren Höhepunkt erreicht
Datenanpassung#
Um Daten an eine Verteilung anzupassen, ist die Maximierung der Likelihood-Funktion üblich. Alternativ haben einige Verteilungen gut bekannte erwartungstreue Schätzer mit minimaler Varianz. Diese werden standardmäßig gewählt, aber die Likelihood-Funktion wird immer zur Minimierung verfügbar sein.
Wenn \(f\left(x;\boldsymbol{\theta}\right)\) die PDF einer Zufallsvariable ist, wobei \(\boldsymbol{\theta}\) ein Parametervektor ist (z. B. \(L\) und \(S\)), dann ist für eine Sammlung von \(N\) unabhängigen Stichproben aus dieser Verteilung die gemeinsame Verteilung des Zufallsvektors \(\mathbf{x}\)
Die Maximum-Likelihood-Schätzung der Parameter \(\boldsymbol{\theta}\) sind die Parameter, die diese Funktion maximieren, wobei \(\mathbf{x}\) fixiert und durch die Daten gegeben ist.
Wobei
Beachten Sie, dass, wenn \(\boldsymbol{\theta}\) nur Formparameter enthält, die Lage- und Skalierungsparameter angepasst werden können, indem \(x_{i}\) durch \(\left(x_{i}-L\right)/S\) in der Log-Likelihood-Funktion ersetzt wird, \(N\log S\) hinzugefügt und minimiert wird, also
Wenn gewünscht, können Stichprobenschätzer für \(L\) und \(S\) (nicht notwendigerweise Maximum-Likelihood-Schätzer) aus Stichprobenschätzern des Mittelwerts und der Varianz unter Verwendung von
erhalten werden, wobei \(\mu\) und \(\mu_{2}\) als Mittelwert und Varianz der **untransformierten** Verteilung (wenn \(L=0\) und \(S=1\)) als bekannt angenommen werden und
Standardnotation für den Mittelwert#
Wir werden verwenden
wobei \(N\) aus dem Kontext als die Anzahl der Stichproben \(x_{i}\) hervorgehen sollte.
Referenzen#
Dokumentation für ranlib, rv2, cdflib
Eric Weissteins Welt der Mathematik http://mathworld.wolfram.com/, http://mathworld.wolfram.com/topics/StatisticalDistributions.html
Dokumentation für Regress+ von Michael McLaughlin, Engineering and Statistics Handbook (NIST), https://www.itl.nist.gov/div898/handbook/
Dokumentation für DATAPLOT von NIST, https://www.itl.nist.gov/div898/software/dataplot/distribu.htm
Norman Johnson, Samuel Kotz und N. Balakrishnan Continuous Univariate Distributions, zweite Auflage, Bände I und II, Wiley & Sons, 1994.
In den Tutorials treten mehrere spezielle Funktionen wiederholt auf und sind hier aufgelistet.
Symbol |
Beschreibung |
Definition |
|---|---|---|
\(\gamma\left(s, x\right)\) |
Unvollständige Gamma-Funktion (links) |
\(\int_0^x t^{s-1} e^{-t} dt\) |
\(\Gamma\left(s, x\right)\) |
Unvollständige Gamma-Funktion (rechts) |
\(\int_x^\infty t^{s-1} e^{-t} dt\) |
\(B\left(x;a,b\right)\) |
Unvollständige Beta-Funktion |
\(\int_{0}^{x} t^{a-1}\left(1-t\right)^{b-1} dt\) |
\(I\left(x;a,b\right)\) |
Regulierte unvollständige Beta-Funktion |
\(\frac{\Gamma\left(a+b\right)}{\Gamma\left(a\right)\Gamma\left(b\right)} \int_{0}^{x} t^{a-1}\left(1-t\right)^{b-1} dt\) |
\(\phi\left(x\right)\) |
PDF für die Normalverteilung |
\(\frac{1}{\sqrt{2\pi}}e^{-x^{2}/2}\) |
\(\Phi\left(x\right)\) |
CDF für die Normalverteilung |
\(\int_{-\infty}^{x}\phi\left(t\right) dt = \frac{1}{2}+\frac{1}{2}\mathrm{erf}\left(\frac{x}{\sqrt{2}}\right)\) |
\(\psi\left(z\right)\) |
Digamma-Funktion |
\(\frac{d}{dz} \log\left(\Gamma\left(z\right)\right)\) |
\(\psi_{n}\left(z\right)\) |
Polygamma-Funktion |
\(\frac{d^{n+1}}{dz^{n+1}}\log\left(\Gamma\left(z\right)\right)\) |
\(I_{\nu}\left(y\right)\) |
Modifizierte Besselfunktion der ersten Art |
|
\(\mathrm{Ei}(\mathrm{z})\) |
Exponentielle Integralfunktion |
\(-\int_{-x}^\infty \frac{e^{-t}}{t} dt\) |
\(\zeta\left(n\right)\) |
Riemannsche Zeta-Funktion |
\(\sum_{k=1}^{\infty} \frac{1}{k^{n}}\) |
\(\zeta\left(n,z\right)\) |
Hurwitzsche Zeta-Funktion |
\(\sum_{k=0}^{\infty} \frac{1}{\left(k+z\right)^{n}}\) |
\(\,{}_{p}F_{q}(a_{1},\ldots,a_{p};b_{1},\ldots,b_{q};z)\) |
Hypergeometrische Funktion |
\(\sum_{n=0}^{\infty} {\frac{(a_{1})_{n}\cdots(a_{p})_{n}}{(b_{1})_{n}\cdots(b_{q})_{n}}} \,{\frac{z^{n}}{n!}}\) |
Kontinuierliche Verteilungen in scipy.stats#
- Alpha-Verteilung
- Anglit-Verteilung
- Bogenus-Verteilung
- Beta-Verteilung
- Beta-Prime-Verteilung
- Bradford-Verteilung
- Burr-Verteilung
- Burr12-Verteilung
- Cauchy-Verteilung
- Schiefe Cauchy-Verteilung
- Chi-Verteilung
- Chi-Quadrat-Verteilung
- Kosinus-Verteilung
- Doppelte Gamma-Verteilung
- Doppelte Pareto-Log-Normal-Verteilung
- Doppelte Weibull-Verteilung
- Erlang-Verteilung
- Exponentialverteilung
- Exponentiell-verteilte Weibull-Verteilung
- Exponential-Potenz-Verteilung
- Ermüdungslebensdauer (Birnbaum-Saunders)-Verteilung
- Fisk (Log-Logistische) Verteilung
- Gefaltete Cauchy-Verteilung
- Gefaltete Normalverteilung
- F-Verteilung (oder F-Ratio)
- Gamma-Verteilung
- Generalisierte Logistische Verteilung
- Generalisierte Pareto-Verteilung
- Generalisierte Exponentialverteilung
- Generalisierte Extremwertverteilung
- Generalisierte Gamma-Verteilung
- Generalisierte Halblogistische Verteilung
- Generalisierte Hyperbolische Verteilung
- Generalisierte Inverse Gaußsche Verteilung
- Generalisierte Normalverteilung
- Gibrat-Verteilung
- Gompertz (Abgeschnittene Gumbel)-Verteilung
- Gumbel (LogWeibull, Fisher-Tippetts, Typ I Extremwert)-Verteilung
- Linksschiefe Gumbel (für minimale Ordnungsstatistik)-Verteilung
- Halb-Cauchy-Verteilung
- Halb-Normalverteilung
- Halb-Logistische Verteilung
- Hyperbolische Sekans-Verteilung
- Gauss-Hypergeometrische Verteilung
- Invertierte Gamma-Verteilung
- Inverse Normalverteilung (Inverse Gaußsche Verteilung)
- Invertierte Weibull-Verteilung
- Jones und Faddy Skew-T-Verteilung
- Johnson SB-Verteilung
- Johnson SU-Verteilung
- KSone-Verteilung
- KStwo-Verteilung
- KStwobign-Verteilung
- Landau-Verteilung
- Laplace (Doppelte Exponential-, Bilaterale Exponential)-Verteilung
- Asymmetrische Laplace-Verteilung
- Linksschiefe Lévy-Verteilung
- Lévy-Verteilung
- Logistische (Sech-Quadrat)-Verteilung
- Log-Doppelte Exponential- (Log-Laplace)-Verteilung
- Log-Gamma-Verteilung
- Log-Normal (Cobb-Douglas)-Verteilung
- Log-Uniform-Verteilung
- Maxwell-Verteilung
- Mielkes Beta-Kappa-Verteilung
- Nakagami-Verteilung
- Nichtzentrale Chi-Quadrat-Verteilung
- Nichtzentrale F-Verteilung
- Nichtzentrale t-Verteilung
- Normalverteilung
- Normal-Inverse-Gaußsche Verteilung
- Pareto-Verteilung
- Pareto zweiter Art (Lomax)-Verteilung
- Potenz-Log-Normal-Verteilung
- Potenz-Normalverteilung
- Potenz-Funktions-Verteilung
- R-Verteilung
- Rayleigh-Verteilung
- Rice-Verteilung
- Reziproke Inverse Gaußsche Verteilung
- Relativistische Breit-Wigner-Verteilung
- Semicirkuläre Verteilung
- Studentisierte Bereichsverteilung
- Student-t-Verteilung
- Trapezförmige Verteilung
- Dreiecksverteilung
- Abgeschnittene Exponentialverteilung
- Abgeschnittene Normalverteilung
- Abgeschnittene Pareto-Verteilung
- Abgeschnittene Weibull-Extremwertverteilung (Minimum)
- Tukey-Lambda-Verteilung
- Gleichverteilung
- Von-Mises-Verteilung
- Wald-Verteilung
- Weibull-Extremwertverteilung (Maximum)
- Weibull-Extremwertverteilung (Minimum)
- Umgewickelte Cauchy-Verteilung