scipy.stats.dpareto_lognorm#

scipy.stats.dpareto_lognorm = <scipy.stats._continuous_distns.dpareto_lognorm_gen Objekt>[Quelle]#

Eine doppelte Pareto-Log-Normal-Zufallsvariable.

Als Instanz der Klasse rv_continuous erbt das Objekt dpareto_lognorm eine Sammlung allgemeiner Methoden (siehe unten für die vollständige Liste) und vervollständigt sie mit Details, die spezifisch für diese spezielle Verteilung sind.

Methoden

rvs(u, s, a, b, loc=0, scale=1, size=1, random_state=None)

Zufallsvariaten.

pdf(x, u, s, a, b, loc=0, scale=1)

Wahrscheinlichkeitsdichtefunktion.

logpdf(x, u, s, a, b, loc=0, scale=1)

Logarithmus der Wahrscheinlichkeitsdichtefunktion.

cdf(x, u, s, a, b, loc=0, scale=1)

Kumulative Verteilungsfunktion.

logcdf(x, u, s, a, b, loc=0, scale=1)

Logarithmus der kumulativen Verteilungsfunktion.

sf(x, u, s, a, b, loc=0, scale=1)

Überlebensfunktion (auch definiert als 1 - cdf, aber sf ist manchmal genauer).

logsf(x, u, s, a, b, loc=0, scale=1)

Logarithmus der Überlebensfunktion.

ppf(q, u, s, a, b, loc=0, scale=1)

Perzentilpunktfunktion (Umkehrung von cdf — Perzentile).

isf(q, u, s, a, b, loc=0, scale=1)

Umgekehrte Überlebensfunktion (Umkehrung von sf).

moment(order, u, s, a, b, loc=0, scale=1)

Nichtzentrales Moment der angegebenen Ordnung.

stats(u, s, a, b, loc=0, scale=1, moments=’mv’)

Mittelwert(‚m‘), Varianz(‚v‘), Schiefe(‚s‘) und/oder Kurtosis(‚k‘).

entropy(u, s, a, b, loc=0, scale=1)

(Differential-)Entropie der RV.

fit(data)

Parameterschätzungen für generische Daten. Siehe scipy.stats.rv_continuous.fit für eine detaillierte Dokumentation der Schlüsselwortargumente.

expect(func, args=(u, s, a, b), loc=0, scale=1, lb=None, ub=None, conditional=False, **kwds)

Erwartungswert einer Funktion (einer Variablen) bezüglich der Verteilung.

median(u, s, a, b, loc=0, scale=1)

Median der Verteilung.

mean(u, s, a, b, loc=0, scale=1)

Mittelwert der Verteilung.

var(u, s, a, b, loc=0, scale=1)

Varianz der Verteilung.

std(u, s, a, b, loc=0, scale=1)

Standardabweichung der Verteilung.

interval(confidence, u, s, a, b, loc=0, scale=1)

Konfidenzintervall mit gleichen Flächen um den Median.

Hinweise

Die Wahrscheinlichkeitsdichtefunktion für dpareto_lognorm ist

\[f(x, \mu, \sigma, \alpha, \beta) = \frac{\alpha \beta}{(\alpha + \beta) x} \phi\left( \frac{\log x - \mu}{\sigma} \right) \left( R(y_1) + R(y_2) \right)\]

wobei \(R(t) = \frac{1 - \Phi(t)}{\phi(t)}\), \(\phi\) und \(\Phi\) die normale PDF und CDF sind, \(y_1 = \alpha \sigma - \frac{\log x - \mu}{\sigma}\) und \(y_2 = \beta \sigma + \frac{\log x - \mu}{\sigma}\) für reelle Zahlen \(x\) und \( \mu\), \(\sigma > 0\), \(\alpha > 0\) und \(\beta > 0\) [1].

dpareto_lognorm verwendet u als Formparameter für \(\mu\), s als Formparameter für \(\sigma\), a als Formparameter für \(\alpha\) und b als Formparameter für \(\beta\).

Eine Zufallsvariable \(X\), die gemäß der obigen PDF verteilt ist, kann als \(X = U \frac{V_1}{V_2}\) dargestellt werden, wobei \(U\), \(V_1\) und \(V_2\) unabhängig sind, \(U\) lognormal verteilt ist, so dass \(\log U \sim N(\mu, \sigma^2)\), und \(V_1\) und \(V_2\) Pareto-Verteilungen mit den Parametern \(\alpha\) bzw. \(\beta\) folgen [2].

Die obige Wahrscheinlichkeitsdichte ist in der „standardisierten“ Form definiert. Verwenden Sie die Parameter loc und scale, um die Verteilung zu verschieben und/oder zu skalieren. Speziell ist dpareto_lognorm.pdf(x, u, s, a, b, loc, scale) identisch gleich dpareto_lognorm.pdf(y, u, s, a, b) / scale mit y = (x - loc) / scale. Beachten Sie, dass das Verschieben des Ortes einer Verteilung keine „nichtzentrale“ Verteilung daraus macht; nichtzentrale Verallgemeinerungen einiger Verteilungen sind in separaten Klassen verfügbar.

Referenzen

[1]

Hajargasht, Gholamreza und William E. Griffiths. „Pareto-lognormal distributions: Inequality, poverty, and estimation from grouped income data.“ Economic Modelling 33 (2013): 593-604.

[2]

Reed, William J. und Murray Jorgensen. „The double Pareto-lognormal distribution - a new parametric model for size distributions.“ Communications in Statistics - Theory and Methods 33.8 (2004): 1733-1753.

Beispiele

>>> import numpy as np
>>> from scipy.stats import dpareto_lognorm
>>> import matplotlib.pyplot as plt
>>> fig, ax = plt.subplots(1, 1)

Ermitteln Sie den Träger (Support)

>>> u, s, a, b = 3, 1.2, 1.5, 2
>>> lb, ub = dpareto_lognorm.support(u, s, a, b)

Berechnen Sie die ersten vier Momente

>>> mean, var, skew, kurt = dpareto_lognorm.stats(u, s, a, b, moments='mvsk')

Zeigen Sie die Wahrscheinlichkeitsdichtefunktion (pdf) an

>>> x = np.linspace(dpareto_lognorm.ppf(0.01, u, s, a, b),
...                 dpareto_lognorm.ppf(0.99, u, s, a, b), 100)
>>> ax.plot(x, dpareto_lognorm.pdf(x, u, s, a, b),
...        'r-', lw=5, alpha=0.6, label='dpareto_lognorm pdf')

Alternativ kann das Verteilungsobjekt (als Funktion) aufgerufen werden, um die Form-, Orts- und Skalierungsparameter festzulegen. Dies gibt ein „eingefrorenes“ RV-Objekt zurück, das die angegebenen Parameter beibehält.

Frieren Sie die Verteilung ein und zeigen Sie die eingefrorene pdf an

>>> rv = dpareto_lognorm(u, s, a, b)
>>> ax.plot(x, rv.pdf(x), 'k-', lw=2, label='frozen pdf')

Überprüfen Sie die Genauigkeit von cdf und ppf

>>> vals = dpareto_lognorm.ppf([0.001, 0.5, 0.999], u, s, a, b)
>>> np.allclose([0.001, 0.5, 0.999], dpareto_lognorm.cdf(vals, u, s, a, b))
True

Generieren Sie Zufallszahlen

>>> r = dpareto_lognorm.rvs(u, s, a, b, size=1000)

Und vergleichen Sie das Histogramm

>>> ax.hist(r, density=True, bins='auto', histtype='stepfilled', alpha=0.2)
>>> ax.set_xlim([x[0], x[-1]])
>>> ax.legend(loc='best', frameon=False)
>>> plt.show()
../../_images/scipy-stats-dpareto_lognorm-1.png