Statistische Funktionen (scipy.stats)#
Dieses Modul enthält eine große Anzahl von Wahrscheinlichkeitsverteilungen, zusammenfassenden und Häufigkeitsstatistiken, Korrelationsfunktionen und statistischen Tests, maskierten Statistiken, Kernel-Dichteschätzung, Quasi-Monte-Carlo-Funktionalität und mehr.
Statistik ist ein sehr großes Gebiet, und es gibt Themen, die außerhalb des Rahmens von SciPy liegen und von anderen Paketen abgedeckt werden. Einige der wichtigsten sind
statsmodels: Regression, lineare Modelle, Zeitreihenanalyse, Erweiterungen von Themen, die auch von
scipy.statsabgedeckt werden.Pandas: Tabellendaten, Zeitreihenfunktionalität, Schnittstellen zu anderen statistischen Sprachen.
PyMC: Bayes'sche statistische Modellierung, probabilistisches maschinelles Lernen.
scikit-learn: Klassifizierung, Regression, Modellauswahl.
Seaborn: Statistische Datenvisualisierung.
rpy2: Python-zu-R-Brücke.
Wahrscheinlichkeitsverteilungen#
Jede univariate Verteilung ist eine Instanz einer Unterklasse von rv_continuous (rv_discrete für diskrete Verteilungen)
|
Eine generische kontinuierliche Zufallsvariablenklasse zur Unterklassifizierung. |
|
Eine generische diskrete Zufallsvariablenklasse zur Unterklassifizierung. |
|
Generiert eine durch ein Histogramm gegebene Verteilung. |
Kontinuierliche Verteilungen#
Eine Alpha-kontinuierliche Zufallsvariable. |
|
Eine Anglit-kontinuierliche Zufallsvariable. |
|
Eine Arkussinus-kontinuierliche Zufallsvariable. |
|
Argus-Verteilung |
|
Eine Beta-kontinuierliche Zufallsvariable. |
|
Eine Beta-Prime-kontinuierliche Zufallsvariable. |
|
Eine Bradford-kontinuierliche Zufallsvariable. |
|
Eine Burr (Typ III) kontinuierliche Zufallsvariable. |
|
Eine Burr (Typ XII) kontinuierliche Zufallsvariable. |
|
Eine Cauchy-kontinuierliche Zufallsvariable. |
|
Eine Chi-kontinuierliche Zufallsvariable. |
|
Eine Chi-Quadrat-kontinuierliche Zufallsvariable. |
|
Eine Kosinus-kontinuierliche Zufallsvariable. |
|
Crystalball-Verteilung |
|
Eine doppelte Gamma-kontinuierliche Zufallsvariable. |
|
Eine doppelte Pareto-Log-Normal-kontinuierliche Zufallsvariable. |
|
Eine doppelte Weibull-kontinuierliche Zufallsvariable. |
|
Eine Erlang-kontinuierliche Zufallsvariable. |
|
Eine Exponential-kontinuierliche Zufallsvariable. |
|
Eine exponentiell modifizierte Normalverteilung (kontinuierlich). |
|
Eine exponentiierte Weibull-kontinuierliche Zufallsvariable. |
|
Eine Exponential-Potenz-kontinuierliche Zufallsvariable. |
|
Eine F-kontinuierliche Zufallsvariable. |
|
Eine Ermüdungslebensdauer- (Birnbaum-Saunders) kontinuierliche Zufallsvariable. |
|
Eine Fisk-kontinuierliche Zufallsvariable. |
|
Eine gefaltete Cauchy-kontinuierliche Zufallsvariable. |
|
Eine gefaltete Normalverteilung (kontinuierlich). |
|
Eine generalisierte logistische kontinuierliche Zufallsvariable. |
|
Eine generalisierte Normalverteilung (kontinuierlich). |
|
Eine generalisierte Pareto-kontinuierliche Zufallsvariable. |
|
Eine generalisierte Exponentialverteilung (kontinuierlich). |
|
Eine generalisierte Extremwertverteilung (kontinuierlich). |
|
Eine Gauß-hypergeometrische kontinuierliche Zufallsvariable. |
|
Eine Gamma-kontinuierliche Zufallsvariable. |
|
Eine generalisierte Gamma-kontinuierliche Zufallsvariable. |
|
Eine generalisierte halb-logistische kontinuierliche Zufallsvariable. |
|
Eine generalisierte hyperbolische kontinuierliche Zufallsvariable. |
|
Eine generalisierte inverse Gaußsche kontinuierliche Zufallsvariable. |
|
Eine Gibrat-kontinuierliche Zufallsvariable. |
|
Eine Gompertz (oder beschnittene Gumbel) kontinuierliche Zufallsvariable. |
|
Eine rechts-schiefe Gumbel-kontinuierliche Zufallsvariable. |
|
Eine links-schiefe Gumbel-kontinuierliche Zufallsvariable. |
|
Eine Halbe-Cauchy-kontinuierliche Zufallsvariable. |
|
Eine halb-logistische kontinuierliche Zufallsvariable. |
|
Eine halb-Normalverteilung (kontinuierlich). |
|
Die obere Hälfte einer generalisierten Normalverteilung (kontinuierlich). |
|
Eine hyperbolische Sekans-kontinuierliche Zufallsvariable. |
|
Eine invertierte Gamma-kontinuierliche Zufallsvariable. |
|
Eine inverse Gaußsche kontinuierliche Zufallsvariable. |
|
Eine invertierte Weibull-kontinuierliche Zufallsvariable. |
|
Eine Irwin-Hall (gleichmäßige Summe) kontinuierliche Zufallsvariable. |
|
Jones und Faddy Schiefe-t-Verteilung. |
|
Eine Johnson SB kontinuierliche Zufallsvariable. |
|
Eine Johnson SU kontinuierliche Zufallsvariable. |
|
Kappa 4-Parameter-Verteilung. |
|
Kappa 3-Parameter-Verteilung. |
|
Verteilung der einseitigen Kolmogorov-Smirnov-Teststatistik. |
|
Verteilung der zweiseitigen Kolmogorov-Smirnov-Teststatistik. |
|
Grenzverteilung der skalierten zweiseitigen Kolmogorov-Smirnov-Teststatistik. |
|
Eine Landau-kontinuierliche Zufallsvariable. |
|
Eine Laplace-kontinuierliche Zufallsvariable. |
|
Eine asymmetrische Laplace-kontinuierliche Zufallsvariable. |
|
Eine Levy-kontinuierliche Zufallsvariable. |
|
Eine links-schiefe Levy-kontinuierliche Zufallsvariable. |
|
Eine Levy-stabile kontinuierliche Zufallsvariable. |
|
Eine logistische (oder Sech-Quadrat) kontinuierliche Zufallsvariable. |
|
Eine log-Gamma-kontinuierliche Zufallsvariable. |
|
Eine log-Laplace-kontinuierliche Zufallsvariable. |
|
Eine logarithmische Normalverteilung (kontinuierlich). |
|
Eine loguniforme oder reziproke kontinuierliche Zufallsvariable. |
|
Eine Lomax (Pareto der zweiten Art) kontinuierliche Zufallsvariable. |
|
Eine Maxwell-kontinuierliche Zufallsvariable. |
|
Eine Mielke Beta-Kappa / Dagum kontinuierliche Zufallsvariable. |
|
Eine Moyal-kontinuierliche Zufallsvariable. |
|
Eine Nakagami-kontinuierliche Zufallsvariable. |
|
Eine nicht-zentrale Chi-Quadrat-kontinuierliche Zufallsvariable. |
|
Eine nicht-zentrale F-Verteilung kontinuierliche Zufallsvariable. |
|
Eine nicht-zentrale Student's t-kontinuierliche Zufallsvariable. |
|
Eine Normalverteilung (kontinuierlich). |
|
Eine Normal-Inverse-Gaußsche kontinuierliche Zufallsvariable. |
|
Eine Pareto-kontinuierliche Zufallsvariable. |
|
Eine Pearson Typ III kontinuierliche Zufallsvariable. |
|
Eine Potenzfunktions-kontinuierliche Zufallsvariable. |
|
Eine Potenz-Log-Normalverteilung (kontinuierlich). |
|
Eine Potenz-Normalverteilung (kontinuierlich). |
|
Eine R-verteilte (symmetrische Beta) kontinuierliche Zufallsvariable. |
|
Eine Rayleigh-kontinuierliche Zufallsvariable. |
|
Eine relativistische Breit-Wigner-Zufallsvariable. |
|
Eine Rice-kontinuierliche Zufallsvariable. |
|
Eine reziproke inverse Gaußsche kontinuierliche Zufallsvariable. |
|
Eine semizirkuläre kontinuierliche Zufallsvariable. |
|
Eine schiefe Cauchy-Zufallsvariable. |
|
Eine schiefe Normalverteilung (kontinuierlich). |
|
Eine studentisierte Bereichs-kontinuierliche Zufallsvariable. |
|
Eine Student's t-kontinuierliche Zufallsvariable. |
|
Eine Trapez-kontinuierliche Zufallsvariable. |
|
Eine Dreiecks-kontinuierliche Zufallsvariable. |
|
Eine beschnittene Exponentialverteilung (kontinuierlich). |
|
Eine beschnittene Normalverteilung (kontinuierlich). |
|
Eine obere beschnittene Pareto-kontinuierliche Zufallsvariable. |
|
Eine doppelt beschnittene Weibull-Minimum-kontinuierliche Zufallsvariable. |
|
Eine Tukey-Lamdba-kontinuierliche Zufallsvariable. |
|
Eine Gleichverteilung (kontinuierlich). |
|
Eine Von Mises-kontinuierliche Zufallsvariable. |
|
Eine Von Mises-kontinuierliche Zufallsvariable. |
|
Eine Wald-kontinuierliche Zufallsvariable. |
|
Weibull-Minimum-kontinuierliche Zufallsvariable. |
|
Weibull-Maximum-kontinuierliche Zufallsvariable. |
|
Eine gewickelte Cauchy-kontinuierliche Zufallsvariable. |
Die Methode fit der univariaten kontinuierlichen Verteilungen verwendet die Maximum-Likelihood-Schätzung, um die Verteilung an einen Datensatz anzupassen. Die Methode fit kann reguläre Daten oder *zensierte Daten* akzeptieren. Zensierte Daten werden mit Instanzen der Klasse CensoredData dargestellt.
|
Instanzen dieser Klasse stellen zensierte Daten dar. |
Multivariate Verteilungen#
Eine multivariate Normalverteilung (Zufallsvariable). |
|
Eine Matrix-Normalverteilung (Zufallsvariable). |
|
Eine Dirichlet-Zufallsvariable. |
|
Eine Dirichlet-multinomiale Zufallsvariable. |
|
Eine Wishart-Zufallsvariable. |
|
Eine inverse Wishart-Zufallsvariable. |
|
Eine multinomiale Zufallsvariable. |
|
Eine spezielle orthogonale Matrix (SO(N)) Zufallsvariable. |
|
Eine orthogonale Matrix (O(N)) Zufallsvariable. |
|
Eine matrix-wertige U(N) Zufallsvariable. |
|
Eine zufällige Korrelationsmatrix. |
|
Eine multivariate t-verteilte Zufallsvariable. |
|
Eine multivariate hypergeometrische Zufallsvariable. |
|
Normal-Inverse-Gamma-Verteilung. |
|
Kontingenztabellen aus unabhängigen Stichproben mit festen Randsummen. |
|
Eine vektorwertige gleichmäßige Richtung. |
|
Eine von Mises-Fisher-Variable. |
Die Methoden von scipy.stats.multivariate_normal akzeptieren Instanzen der folgenden Klasse zur Darstellung der Kovarianz.
Darstellung einer Kovarianzmatrix |
Diskrete Verteilungen#
Eine Bernoulli-diskrete Zufallsvariable. |
|
Eine Beta-Binomial-diskrete Zufallsvariable. |
|
Eine Beta-Negativ-Binomial-diskrete Zufallsvariable. |
|
Eine Binomial-diskrete Zufallsvariable. |
|
Eine Boltzmann- (beschnittene diskrete Exponential-) Zufallsvariable. |
|
Eine Laplace-diskrete Zufallsvariable. |
|
Eine geometrische diskrete Zufallsvariable. |
|
Eine hypergeometrische diskrete Zufallsvariable. |
|
Eine logarithmische (Log-Serie, Serie) diskrete Zufallsvariable. |
|
Eine negative Binomial-diskrete Zufallsvariable. |
|
Eine Fisher'sche nicht-zentrale hypergeometrische diskrete Zufallsvariable. |
|
Eine Wallenius'sche nicht-zentrale hypergeometrische diskrete Zufallsvariable. |
|
Eine negative hypergeometrische diskrete Zufallsvariable. |
|
Eine Planck-diskrete Exponential-Zufallsvariable. |
|
Eine Poisson-diskrete Zufallsvariable. |
|
Eine Poisson-Binomial-diskrete Zufallsvariable. |
|
Eine Gleichverteilung (diskret). |
|
Eine Skellam-diskrete Zufallsvariable. |
|
Eine Yule-Simon-diskrete Zufallsvariable. |
|
Eine Zipf- (Zeta-) diskrete Zufallsvariable. |
|
Eine Zipfian-diskrete Zufallsvariable. |
Eine Übersicht über statistische Funktionen finden Sie unten. Viele dieser Funktionen haben eine ähnliche Version in scipy.stats.mstats, die für maskierte Arrays funktioniert.
Zusammenfassende Statistiken#
|
Berechnet mehrere deskriptive Statistiken der übergebenen Matrix. |
|
Berechnet das gewichtete geometrische Mittel entlang der angegebenen Achse. |
|
Berechnet den gewichteten harmonischen Mittelwert entlang der angegebenen Achse. |
|
Berechnet das gewichtete Potenzmittel entlang der angegebenen Achse. |
|
Berechnet die Kurtosis (Fisher oder Pearson) eines Datensatzes. |
|
Gibt eine Matrix des modalen (häufigsten) Werts in der übergebenen Matrix zurück. |
|
Berechnet das n-te Moment um den Mittelwert einer Stichprobe. |
|
Berechnet L-Momente einer Stichprobe aus einer kontinuierlichen Verteilung. |
|
Berechnet die Erwartungswertgröße (expectile) auf dem angegebenen Niveau. |
|
Berechnet die Stichprobenschiefe eines Datensatzes. |
|
Gibt die n-te k-Statistik zurück (bisher |
|
Gibt einen unverzerrten Schätzer für die Varianz der k-Statistik zurück. |
|
Berechnet den getrimmten Mittelwert. |
|
Berechnet die beschnittene Varianz. |
|
Berechnet das beschnittene Minimum. |
|
Berechnet das beschnittene Maximum. |
|
Berechnet die beschnittene Stichprobenstandardabweichung. |
|
Berechnet den getrimmten Standardfehler des Mittelwerts. |
|
Berechnet den Variationskoeffizienten. |
|
Findet Wiederholungen und deren Häufigkeiten. |
|
Weist Daten Ränge zu und behandelt Gleichstände angemessen. |
|
Korrekturfaktor für Gleichstände bei Mann-Whitney-U- und Kruskal-Wallis-H-Tests. |
|
Gibt den Mittelwert einer Matrix nach dem Entfernen eines bestimmten Bruchteils extremer Werte zurück. |
|
Berechnet die geometrische Standardabweichung einer Matrix. |
|
Berechnet den Interquartilsabstand der Daten entlang der angegebenen Achse. |
|
Berechnet den Standardfehler des Mittels. |
|
Bayes'sche Konfidenzintervalle für Mittelwert, Varianz und Standardabweichung. |
|
'Eingefrorene' Verteilungen für Mittelwert, Varianz und Standardabweichung von Daten. |
|
Berechnet die Shannon-Entropie / relative Entropie gegebener Verteilungen. |
|
Schätzt die differentielle Entropie aus einer Stichprobe einer Verteilung. |
|
Berechnet die mediane absolute Abweichung der Daten entlang der angegebenen Achse. |
Häufigkeitsstatistiken#
|
Gibt ein kumulatives Häufigkeitshistogramm zurück, das die Histogrammfunktion verwendet. |
|
Berechnet das p-Quantil der Daten entlang der angegebenen Achse. |
|
Berechnet den Perzentilrang eines Scores relativ zu einer Liste von Scores. |
|
Berechnet den Score bei einem gegebenen Perzentil der Eingabesequenz. |
|
Gibt ein relatives Häufigkeitshistogramm zurück, das die Histogrammfunktion verwendet. |
|
Berechnet eine binnierte Statistik für einen oder mehrere Datensätze. |
|
Berechnet eine bidimensionale binnierte Statistik für einen oder mehrere Datensätze. |
|
Berechnet eine multidimensionale binnierte Statistik für einen Datensatz. |
Zufallsvariablen#
|
Erzeugt eine UnivariateDistribution-Klasse aus einem kompatiblen Objekt. |
|
Normalverteilung mit vorgeschriebenem Mittelwert und Standardabweichung. |
|
Gleichverteilung. |
|
Binomialverteilung mit vorgeschriebener Erfolgswahrscheinlichkeit und Anzahl der Versuche. |
|
Repräsentation einer Mischverteilung. |
|
Wahrscheinlichkeitsverteilung einer Ordnungsstatistik. |
|
Beschneidet die Unterstützung einer Zufallsvariablen. |
|
Absolutwert einer Zufallsvariablen. |
|
Natürlicher Exponentialwert einer Zufallsvariablen. |
|
Natürlicher Logarithmus einer nicht-negativen Zufallsvariablen. |
Quasi-Monte-Carlo#
Kontingenztabellen#
Maskierte Statistikfunktionen#
- Statistische Funktionen für maskierte Arrays (
scipy.stats.mstats)- Zusammenfassende Statistiken
- Häufigkeitsstatistiken
- Korrelationsfunktionen
- Statistische Tests
- Transformationen
- Sonstiges
Weitere statistische Funktionalität#
Transformationen#
|
Gibt einen Datensatz zurück, der durch eine Box-Cox-Potenztransformation transformiert wurde. |
|
Berechnet den optimalen Box-Cox-Transformationsparameter für Eingabedaten. |
|
Die Boxcox-Log-Likelihood-Funktion. |
|
Gibt einen Datensatz zurück, der durch eine Yeo-Johnson-Potenztransformation transformiert wurde. |
|
Berechnet den optimalen Yeo-Johnson-Transformationsparameter. |
|
Die Yeojohnson-Log-Likelihood-Funktion. |
|
Berechnet die O'Brien-Transformation auf Eingabedaten (beliebige Anzahl von Arrays). |
|
Führt iterative Sigma-Clipping von Array-Elementen durch. |
|
Schneidet einen Anteil von beiden Enden eines Arrays ab. |
|
Schneidet einen Anteil von EINEM Ende des übergebenen Array-Verteilung ab. |
|
Berechnet die relativen z-Scores. |
|
Berechnet den z-Score. |
|
Berechnet den geometrischen Standardwert. |
Statistische Distanzen#
|
Berechnet die Wasserstein-1-Distanz zwischen zwei 1D-diskreten Verteilungen. |
|
Berechnet die Wasserstein-1-Distanz zwischen zwei N-D-diskreten Verteilungen. |
|
Berechnet die Energiedistanz zwischen zwei 1D-Verteilungen. |
Sampling#
Anpassung / Überlebenszeitanalyse#
Richtungsspezifische statistische Funktionen#
|
Berechnet Stichprobenstatistiken für richtungsgebundene Daten. |
|
Berechnet den zirkulären Mittelwert einer Stichprobe von Winkelbeobachtungen. |
|
Berechnet die zirkuläre Varianz einer Stichprobe von Winkelbeobachtungen. |
|
Berechnet die zirkuläre Standardabweichung einer Stichprobe von Winkelbeobachtungen. |
Sensitivitätsanalyse#
|
Globale Sensitivitätsindizes von Sobol'. |
Plot-Tests#
|
Berechnet den Formparameter, der das PPCC maximiert. |
|
Berechnet und plottet optional den Wahrscheinlichkeitsplot-Korrelationskoeffizienten. |
|
Berechnet Quantile für einen Wahrscheinlichkeitsplot und zeigt optional den Plot an. |
|
Berechnet Parameter für einen Box-Cox-Normalitätsplot und zeigt ihn optional an. |
|
Berechnet Parameter für einen Yeo-Johnson-Normalitätsplot und zeigt ihn optional an. |
Univariate und multivariate Kerndichteschätzung#
|
Repräsentation einer Kerndichteschätzung mit Gaußschen Kernen. |
Warnungen / Fehler, die in scipy.stats verwendet werden#
|
Warnt, wenn Daten degeneriert sind und Ergebnisse möglicherweise nicht zuverlässig sind. |
|
Warnt, wenn alle Werte in den Daten exakt gleich sind. |
|
Warnt, wenn alle Werte in den Daten fast gleich sind. |
|
Stellt einen Fehlerzustand beim Anpassen einer Verteilung an Daten dar. |
Ergebnisklassen, die in scipy.stats verwendet werden#
Warnung
Diese Klassen sind privat, werden aber hier aufgeführt, da Instanzen von ihnen von anderen statistischen Funktionen zurückgegeben werden. Benutzerimport und -instanziierung werden nicht unterstützt.