scipy.stats.geom#

scipy.stats.geom = <scipy.stats._discrete_distns.geom_gen Objekt>[Quelle]#

Eine geometrische diskrete Zufallsvariable.

Als Instanz der Klasse rv_discrete erbt das Objekt geom davon eine Sammlung generischer Methoden (siehe unten für die vollständige Liste) und vervollständigt sie mit spezifischen Details für diese spezielle Verteilung.

Methoden

rvs(p, loc=0, size=1, random_state=None)

Zufallsvariaten.

pmf(k, p, loc=0)

Wahrscheinlichkeitsmassenfunktion.

logpmf(k, p, loc=0)

Logarithmus der Wahrscheinlichkeitsmassenfunktion.

cdf(k, p, loc=0)

Kumulative Verteilungsfunktion.

logcdf(k, p, loc=0)

Logarithmus der kumulativen Verteilungsfunktion.

sf(k, p, loc=0)

Überlebensfunktion (auch definiert als 1 - cdf, aber sf ist manchmal genauer).

logsf(k, p, loc=0)

Logarithmus der Überlebensfunktion.

ppf(q, p, loc=0)

Perzentilpunktfunktion (Umkehrung von cdf — Perzentile).

isf(q, p, loc=0)

Umgekehrte Überlebensfunktion (Umkehrung von sf).

stats(p, loc=0, moments=’mv’)

Mittelwert(‚m‘), Varianz(‚v‘), Schiefe(‚s‘) und/oder Kurtosis(‚k‘).

entropy(p, loc=0)

(Differential-)Entropie der RV.

expect(func, args=(p,), loc=0, lb=None, ub=None, conditional=False)

Erwartungswert einer Funktion (einer Variablen) bezüglich der Verteilung.

median(p, loc=0)

Median der Verteilung.

mean(p, loc=0)

Mittelwert der Verteilung.

var(p, loc=0)

Varianz der Verteilung.

std(p, loc=0)

Standardabweichung der Verteilung.

interval(confidence, p, loc=0)

Konfidenzintervall mit gleichen Flächen um den Median.

Siehe auch

planck

Hinweise

Die Wahrscheinlichkeitsmassenfunktion für geom ist

\[f(k) = (1-p)^{k-1} p\]

für \(k \ge 1\), \(0 < p \leq 1\)

geom nimmt \(p\) als Formparameter, wobei \(p\) die Wahrscheinlichkeit eines einzelnen Erfolgs und \(1-p\) die Wahrscheinlichkeit eines einzelnen Fehlschlags ist.

Beachten Sie, dass die Wahrscheinlichkeit von Beobachtungen, die np.iinfo(np.int64).max überschreiten, bei der Ziehung von Zufallsstichproben schnell ansteigt, wenn $p$ unter $10^{-17}$ fällt. Für $p < 10^{-20}$ würden fast alle Beobachtungen das Maximum von int64 überschreiten; der Ausgabetyp ist jedoch immer int64, sodass diese Werte auf das Maximum begrenzt werden.

Die oben genannte Wahrscheinlichkeitsmassenfunktion ist in der „standardisierten“ Form definiert. Um die Verteilung zu verschieben, verwenden Sie den Parameter loc. Insbesondere ist geom.pmf(k, p, loc) identisch äquivalent zu geom.pmf(k - loc, p).

Beispiele

>>> import numpy as np
>>> from scipy.stats import geom
>>> import matplotlib.pyplot as plt
>>> fig, ax = plt.subplots(1, 1)

Ermitteln Sie den Träger (Support)

>>> p = 0.5
>>> lb, ub = geom.support(p)

Berechnen Sie die ersten vier Momente

>>> mean, var, skew, kurt = geom.stats(p, moments='mvsk')

Anzeigen der Wahrscheinlichkeitsmassenfunktion (pmf)

>>> x = np.arange(geom.ppf(0.01, p),
...               geom.ppf(0.99, p))
>>> ax.plot(x, geom.pmf(x, p), 'bo', ms=8, label='geom pmf')
>>> ax.vlines(x, 0, geom.pmf(x, p), colors='b', lw=5, alpha=0.5)

Alternativ kann das Verteilungsobjekt (als Funktion) aufgerufen werden, um die Form und den Ort festzulegen. Dies gibt ein „eingefrorenes“ RV-Objekt zurück, das die angegebenen Parameter beibehält.

Die Verteilung einfrieren und die eingefrorene pmf anzeigen

>>> rv = geom(p)
>>> ax.vlines(x, 0, rv.pmf(x), colors='k', linestyles='-', lw=1,
...         label='frozen pmf')
>>> ax.legend(loc='best', frameon=False)
>>> plt.show()
../../_images/scipy-stats-geom-1_00_00.png

Überprüfen Sie die Genauigkeit von cdf und ppf

>>> prob = geom.cdf(x, p)
>>> np.allclose(x, geom.ppf(prob, p))
True

Generieren Sie Zufallszahlen

>>> r = geom.rvs(p, size=1000)