scipy.stats.pareto#

scipy.stats.pareto = <scipy.stats._continuous_distns.pareto_gen Objekt>[Quelle]#

Eine Pareto-stetige Zufallsvariable.

Als Instanz der Klasse rv_continuous erbt das Objekt pareto davon eine Sammlung generischer Methoden (siehe unten für die vollständige Liste) und ergänzt diese um spezifische Details für diese spezielle Verteilung.

Methoden

rvs(b, loc=0, scale=1, size=1, random_state=None)

Zufallsvariaten.

pdf(x, b, loc=0, scale=1)

Wahrscheinlichkeitsdichtefunktion.

logpdf(x, b, loc=0, scale=1)

Logarithmus der Wahrscheinlichkeitsdichtefunktion.

cdf(x, b, loc=0, scale=1)

Kumulative Verteilungsfunktion.

logcdf(x, b, loc=0, scale=1)

Logarithmus der kumulativen Verteilungsfunktion.

sf(x, b, loc=0, scale=1)

Überlebensfunktion (auch definiert als 1 - cdf, aber sf ist manchmal genauer).

logsf(x, b, loc=0, scale=1)

Logarithmus der Überlebensfunktion.

ppf(q, b, loc=0, scale=1)

Perzentilpunktfunktion (Umkehrung von cdf — Perzentile).

isf(q, b, loc=0, scale=1)

Umgekehrte Überlebensfunktion (Umkehrung von sf).

moment(order, b, loc=0, scale=1)

Nichtzentrales Moment der angegebenen Ordnung.

stats(b, loc=0, scale=1, moments=’mv’)

Mittelwert(‚m‘), Varianz(‚v‘), Schiefe(‚s‘) und/oder Kurtosis(‚k‘).

entropy(b, loc=0, scale=1)

(Differential-)Entropie der RV.

fit(data)

Parameterschätzungen für generische Daten. Siehe scipy.stats.rv_continuous.fit für eine detaillierte Dokumentation der Schlüsselwortargumente.

expect(func, args=(b,), loc=0, scale=1, lb=None, ub=None, conditional=False, **kwds)

Erwartungswert einer Funktion (einer Variablen) bezüglich der Verteilung.

median(b, loc=0, scale=1)

Median der Verteilung.

mean(b, loc=0, scale=1)

Mittelwert der Verteilung.

var(b, loc=0, scale=1)

Varianz der Verteilung.

std(b, loc=0, scale=1)

Standardabweichung der Verteilung.

interval(confidence, b, loc=0, scale=1)

Konfidenzintervall mit gleichen Flächen um den Median.

Hinweise

Die Wahrscheinlichkeitsdichtefunktion für pareto ist

\[f(x, b) = \frac{b}{x^{b+1}}\]

für \(x \ge 1\), \(b > 0\).

pareto verwendet b als Formparameter für \(b\).

Die obige Wahrscheinlichkeitsdichte ist in der "standardisierten" Form definiert. Um die Verteilung zu verschieben und/oder zu skalieren, verwenden Sie die Parameter loc und scale. Insbesondere ist pareto.pdf(x, b, loc, scale) identisch äquivalent zu pareto.pdf(y, b) / scale mit y = (x - loc) / scale. Beachten Sie, dass das Verschieben des Ortes einer Verteilung diese nicht zu einer "nichtzentralen" Verteilung macht; nichtzentrale Verallgemeinerungen einiger Verteilungen sind in separaten Klassen verfügbar.

Beispiele

>>> import numpy as np
>>> from scipy.stats import pareto
>>> import matplotlib.pyplot as plt
>>> fig, ax = plt.subplots(1, 1)

Ermitteln Sie den Träger (Support)

>>> b = 2.62
>>> lb, ub = pareto.support(b)

Berechnen Sie die ersten vier Momente

>>> mean, var, skew, kurt = pareto.stats(b, moments='mvsk')

Zeigen Sie die Wahrscheinlichkeitsdichtefunktion (pdf) an

>>> x = np.linspace(pareto.ppf(0.01, b),
...                 pareto.ppf(0.99, b), 100)
>>> ax.plot(x, pareto.pdf(x, b),
...        'r-', lw=5, alpha=0.6, label='pareto pdf')

Alternativ kann das Verteilungsobjekt (als Funktion) aufgerufen werden, um die Form-, Orts- und Skalierungsparameter festzulegen. Dies gibt ein „eingefrorenes“ RV-Objekt zurück, das die angegebenen Parameter beibehält.

Frieren Sie die Verteilung ein und zeigen Sie die eingefrorene pdf an

>>> rv = pareto(b)
>>> ax.plot(x, rv.pdf(x), 'k-', lw=2, label='frozen pdf')

Überprüfen Sie die Genauigkeit von cdf und ppf

>>> vals = pareto.ppf([0.001, 0.5, 0.999], b)
>>> np.allclose([0.001, 0.5, 0.999], pareto.cdf(vals, b))
True

Generieren Sie Zufallszahlen

>>> r = pareto.rvs(b, size=1000)

Und vergleichen Sie das Histogramm

>>> ax.hist(r, density=True, bins='auto', histtype='stepfilled', alpha=0.2)
>>> ax.set_xlim([x[0], x[-1]])
>>> ax.legend(loc='best', frameon=False)
>>> plt.show()
../../_images/scipy-stats-pareto-1.png