scipy.stats.f#

scipy.stats.f = <scipy.stats._continuous_distns.f_gen Objekt>[Quelle]#

Eine F kontinuierliche Zufallsvariable.

Für die nichtzentrale F-Verteilung siehe ncf.

Als Instanz der rv_continuous-Klasse erbt f von ihr eine Sammlung allgemeiner Methoden (siehe unten für die vollständige Liste) und ergänzt diese um Details, die spezifisch für diese Verteilung sind.

Methoden

rvs(dfn, dfd, loc=0, scale=1, size=1, random_state=None)

Zufallsvariaten.

pdf(x, dfn, dfd, loc=0, scale=1)

Wahrscheinlichkeitsdichtefunktion.

logpdf(x, dfn, dfd, loc=0, scale=1)

Logarithmus der Wahrscheinlichkeitsdichtefunktion.

cdf(x, dfn, dfd, loc=0, scale=1)

Kumulative Verteilungsfunktion.

logcdf(x, dfn, dfd, loc=0, scale=1)

Logarithmus der kumulativen Verteilungsfunktion.

sf(x, dfn, dfd, loc=0, scale=1)

Überlebensfunktion (auch definiert als 1 - cdf, aber sf ist manchmal genauer).

logsf(x, dfn, dfd, loc=0, scale=1)

Logarithmus der Überlebensfunktion.

ppf(q, dfn, dfd, loc=0, scale=1)

Perzentilpunktfunktion (Umkehrung von cdf — Perzentile).

isf(q, dfn, dfd, loc=0, scale=1)

Umgekehrte Überlebensfunktion (Umkehrung von sf).

moment(order, dfn, dfd, loc=0, scale=1)

Nichtzentrales Moment der angegebenen Ordnung.

stats(dfn, dfd, loc=0, scale=1, moments=’mv’)

Mittelwert(‚m‘), Varianz(‚v‘), Schiefe(‚s‘) und/oder Kurtosis(‚k‘).

entropy(dfn, dfd, loc=0, scale=1)

(Differential-)Entropie der RV.

fit(data)

Parameterschätzungen für generische Daten. Siehe scipy.stats.rv_continuous.fit für eine detaillierte Dokumentation der Schlüsselwortargumente.

expect(func, args=(dfn, dfd), loc=0, scale=1, lb=None, ub=None, conditional=False, **kwds)

Erwartungswert einer Funktion (einer Variablen) bezüglich der Verteilung.

median(dfn, dfd, loc=0, scale=1)

Median der Verteilung.

mean(dfn, dfd, loc=0, scale=1)

Mittelwert der Verteilung.

var(dfn, dfd, loc=0, scale=1)

Varianz der Verteilung.

std(dfn, dfd, loc=0, scale=1)

Standardabweichung der Verteilung.

interval(confidence, dfn, dfd, loc=0, scale=1)

Konfidenzintervall mit gleichen Flächen um den Median.

Siehe auch

ncf

Hinweise

Die F-Verteilung mit Freiheitsgraden \(df_1 > 0\) und \(df_2 > 0\) ist die Verteilung des Verhältnisses zweier unabhängiger Chi-Quadrat-Verteilungen mit \(df_1\) und \(df_2\) Freiheitsgraden, nach Skalierung um \(df_2 / df_1\).

Die Wahrscheinlichkeitsdichtefunktion für f ist

\[f(x, df_1, df_2) = \frac{df_2^{df_2/2} df_1^{df_1/2} x^{df_1 / 2-1}} {(df_2+df_1 x)^{(df_1+df_2)/2} B(df_1/2, df_2/2)}\]

für \(x > 0\).

f akzeptiert die Formparameter dfn und dfd für \(df_1\), die Freiheitsgrade der Chi-Quadrat-Verteilung im Zähler, und \(df_2\), die Freiheitsgrade der Chi-Quadrat-Verteilung im Nenner, jeweils.

Die obige Wahrscheinlichkeitsdichte ist in der "standardisierten" Form definiert. Um die Verteilung zu verschieben und/oder zu skalieren, verwenden Sie die Parameter loc und scale. Insbesondere ist f.pdf(x, dfn, dfd, loc, scale) identisch äquivalent zu f.pdf(y, dfn, dfd) / scale mit y = (x - loc) / scale. Beachten Sie, dass das Verschieben des Ortes einer Verteilung diese nicht zu einer "nichtzentralen" Verteilung macht; nichtzentrale Verallgemeinerungen einiger Verteilungen sind in separaten Klassen verfügbar.

Beispiele

>>> import numpy as np
>>> from scipy.stats import f
>>> import matplotlib.pyplot as plt
>>> fig, ax = plt.subplots(1, 1)

Ermitteln Sie den Träger (Support)

>>> dfn, dfd = 29, 18
>>> lb, ub = f.support(dfn, dfd)

Berechnen Sie die ersten vier Momente

>>> mean, var, skew, kurt = f.stats(dfn, dfd, moments='mvsk')

Zeigen Sie die Wahrscheinlichkeitsdichtefunktion (pdf) an

>>> x = np.linspace(f.ppf(0.01, dfn, dfd),
...                 f.ppf(0.99, dfn, dfd), 100)
>>> ax.plot(x, f.pdf(x, dfn, dfd),
...        'r-', lw=5, alpha=0.6, label='f pdf')

Alternativ kann das Verteilungsobjekt (als Funktion) aufgerufen werden, um die Form-, Orts- und Skalierungsparameter festzulegen. Dies gibt ein „eingefrorenes“ RV-Objekt zurück, das die angegebenen Parameter beibehält.

Frieren Sie die Verteilung ein und zeigen Sie die eingefrorene pdf an

>>> rv = f(dfn, dfd)
>>> ax.plot(x, rv.pdf(x), 'k-', lw=2, label='frozen pdf')

Überprüfen Sie die Genauigkeit von cdf und ppf

>>> vals = f.ppf([0.001, 0.5, 0.999], dfn, dfd)
>>> np.allclose([0.001, 0.5, 0.999], f.cdf(vals, dfn, dfd))
True

Generieren Sie Zufallszahlen

>>> r = f.rvs(dfn, dfd, size=1000)

Und vergleichen Sie das Histogramm

>>> ax.hist(r, density=True, bins='auto', histtype='stepfilled', alpha=0.2)
>>> ax.set_xlim([x[0], x[-1]])
>>> ax.legend(loc='best', frameon=False)
>>> plt.show()
../../_images/scipy-stats-f-1.png