scipy.stats.zipf#

scipy.stats.zipf = <scipy.stats._discrete_distns.zipf_gen Objekt>[Quelle]#

Eine diskrete Zufallsvariable vom Typ Zipf (Zeta).

Als Instanz der Klasse rv_discrete erbt zipf davon eine Sammlung generischer Methoden (siehe unten für die vollständige Liste) und vervollständigt diese mit Details, die spezifisch für diese Verteilung sind.

Methoden

rvs(a, loc=0, size=1, random_state=None)

Zufallsvariaten.

pmf(k, a, loc=0)

Wahrscheinlichkeitsmassenfunktion.

logpmf(k, a, loc=0)

Logarithmus der Wahrscheinlichkeitsmassenfunktion.

cdf(k, a, loc=0)

Kumulative Verteilungsfunktion.

logcdf(k, a, loc=0)

Logarithmus der kumulativen Verteilungsfunktion.

sf(k, a, loc=0)

Überlebensfunktion (auch definiert als 1 - cdf, aber sf ist manchmal genauer).

logsf(k, a, loc=0)

Logarithmus der Überlebensfunktion.

ppf(q, a, loc=0)

Perzentilpunktfunktion (Umkehrung von cdf — Perzentile).

isf(q, a, loc=0)

Umgekehrte Überlebensfunktion (Umkehrung von sf).

stats(a, loc=0, moments=’mv’)

Mittelwert(‚m‘), Varianz(‚v‘), Schiefe(‚s‘) und/oder Kurtosis(‚k‘).

entropy(a, loc=0)

(Differential-)Entropie der RV.

expect(func, args=(a,), loc=0, lb=None, ub=None, conditional=False)

Erwartungswert einer Funktion (einer Variablen) bezüglich der Verteilung.

median(a, loc=0)

Median der Verteilung.

mean(a, loc=0)

Mittelwert der Verteilung.

var(a, loc=0)

Varianz der Verteilung.

std(a, loc=0)

Standardabweichung der Verteilung.

interval(confidence, a, loc=0)

Konfidenzintervall mit gleichen Flächen um den Median.

Siehe auch

zipfian

Hinweise

Die Wahrscheinlichkeitsmassenfunktion für zipf ist

\[f(k, a) = \frac{1}{\zeta(a) k^a}\]

für \(k \ge 1\), \(a > 1\).

zipf nimmt \(a > 1\) als Formparameter. \(\zeta\) ist die Riemannsche Zeta-Funktion (scipy.special.zeta)

Die Zeta-Verteilung ist auch als Zipf-Verteilung bekannt, die ein Spezialfall der Zipfian-Verteilung (zipfian) ist.

Die obige Wahrscheinlichkeitsmassenfunktion ist in der „standardisierten“ Form definiert. Um die Verteilung zu verschieben, verwenden Sie den Parameter loc. Insbesondere ist zipf.pmf(k, a, loc) identisch äquivalent zu zipf.pmf(k - loc, a).

Referenzen

[1]

„Zeta Distribution“, Wikipedia, https://en.wikipedia.org/wiki/Zeta_distribution

Beispiele

>>> import numpy as np
>>> from scipy.stats import zipf
>>> import matplotlib.pyplot as plt
>>> fig, ax = plt.subplots(1, 1)

Ermitteln Sie den Träger (Support)

>>> a = 6.6
>>> lb, ub = zipf.support(a)

Berechnen Sie die ersten vier Momente

>>> mean, var, skew, kurt = zipf.stats(a, moments='mvsk')

Anzeigen der Wahrscheinlichkeitsmassenfunktion (pmf)

>>> x = np.arange(zipf.ppf(0.01, a),
...               zipf.ppf(0.99, a))
>>> ax.plot(x, zipf.pmf(x, a), 'bo', ms=8, label='zipf pmf')
>>> ax.vlines(x, 0, zipf.pmf(x, a), colors='b', lw=5, alpha=0.5)

Alternativ kann das Verteilungsobjekt (als Funktion) aufgerufen werden, um die Form und den Ort festzulegen. Dies gibt ein „eingefrorenes“ RV-Objekt zurück, das die angegebenen Parameter beibehält.

Die Verteilung einfrieren und die eingefrorene pmf anzeigen

>>> rv = zipf(a)
>>> ax.vlines(x, 0, rv.pmf(x), colors='k', linestyles='-', lw=1,
...         label='frozen pmf')
>>> ax.legend(loc='best', frameon=False)
>>> plt.show()
../../_images/scipy-stats-zipf-1_00_00.png

Überprüfen Sie die Genauigkeit von cdf und ppf

>>> prob = zipf.cdf(x, a)
>>> np.allclose(x, zipf.ppf(prob, a))
True

Generieren Sie Zufallszahlen

>>> r = zipf.rvs(a, size=1000)

Bestätigen Sie, dass zipf der Grenzwert für große n von zipfian ist.

>>> import numpy as np
>>> from scipy.stats import zipf, zipfian
>>> k = np.arange(11)
>>> np.allclose(zipf.pmf(k, a), zipfian.pmf(k, a, n=10000000))
True