Yule-Simon-Verteilung#

Eine Yule-Simon-Zufallsvariable mit dem Parameter \(\alpha>0\) kann als Mischung von Exponential-Zufallsvariaten dargestellt werden. Um dies zu sehen, bezeichnen wir \(W\) als eine Exponential-Zufallsvariable mit Rate \(\rho\) und eine geometrische Zufallsvariable \(K\) mit Wahrscheinlichkeit \(1-exp(-W)\), dann hat \(K\) marginal eine Yule-Simon-Verteilung. Die oben beschriebene latente Variablenrepräsentation wird zur Generierung von Zufallsvariaten verwendet.

\begin{eqnarray*} p \left( k; \alpha \right) & = & \alpha \frac{\Gamma\left(k\right)\Gamma\left(\alpha + 1\right)}{\Gamma\left(k+\alpha+1\right)} \\ F \left( k; \alpha \right) & = & 1 - \frac{ k \Gamma\left(k\right)\Gamma\left(\alpha + 1\right)}{\Gamma\left(k+\alpha+1\right)} \end{eqnarray*}

für \(k = 1,2,...\).

Nun gilt

\begin{eqnarray*} \mu & = & \frac{\alpha}{\alpha-1}\\ \mu_{2} & = & \frac{\alpha^2}{\left(\alpha-1\right)^2\left( \alpha - 2 \right)}\\ \gamma_{1} & = & \frac{ \sqrt{\left( \alpha - 2 \right)} \left( \alpha + 1 \right)^2}{ \alpha \left( \alpha - 3 \right)}\\ \gamma_{2} & = & \frac{ \left(\alpha + 3\right) + \left(\alpha^3 - 49\alpha - 22\right)}{\alpha \left(\alpha - 4\right)\left(\alpha - 3 \right) } \end{eqnarray*}

für \(\alpha>1\), andernfalls ist der Mittelwert unendlich und die Varianz existiert nicht. Für die Varianz muss \(\alpha>2\) gelten, andernfalls existiert die Varianz nicht. Ebenso müssen für endliche Schiefe und Kurtosis \(\alpha>3\) bzw. \(\alpha>4\) gelten.

Implementierung: scipy.stats.yulesimon