scipy.stats.

skew#

scipy.stats.skew(a, axis=0, bias=True, nan_policy='propagate', *, keepdims=False)[Quelle]#

Berechnet die Stichproben-Schiefe eines Datensatzes.

Für normalverteilte Daten sollte die Schiefe ungefähr Null sein. Für unimodale kontinuierliche Verteilungen bedeutet ein Schiefewert größer als Null, dass mehr Gewicht im rechten Schwanz der Verteilung liegt. Die Funktion skewtest kann verwendet werden, um festzustellen, ob der Schiefewert statistisch gesehen nahe genug bei Null liegt.

Parameter:
andarray

Eingabearray.

axisint oder None, Standard: 0

Wenn es sich um eine ganze Zahl handelt, ist dies die Achse des Eingabearrays, entlang der die Statistik berechnet wird. Die Statistik jedes Achsen-Slices (z. B. Zeile) der Eingabe erscheint dann in einem entsprechenden Element der Ausgabe. Wenn None, wird die Eingabe vor der Berechnung der Statistik geglättet.

biasbool, optional

Wenn False, werden die Berechnungen zur Eliminierung statistischer Verzerrungen korrigiert.

nan_policy{‘propagate’, ‘omit’, ‘raise’}

Definiert, wie Eingabe-NaNs behandelt werden.

  • propagate: Wenn ein NaN in der Achsen-Slice (z. B. Zeile) vorhanden ist, entlang der die Statistik berechnet wird, wird der entsprechende Eintrag der Ausgabe NaN sein.

  • omit: NaNs werden bei der Berechnung weggelassen. Wenn im Achsen-Slice, entlang dem die Statistik berechnet wird, nicht genügend Daten verbleiben, wird der entsprechende Eintrag der Ausgabe NaN sein.

  • raise: Wenn ein NaN vorhanden ist, wird ein ValueError ausgelöst.

keepdimsbool, Standard: False

Wenn dies auf True gesetzt ist, bleiben die reduzierten Achsen im Ergebnis als Dimensionen mit der Größe eins erhalten. Mit dieser Option wird das Ergebnis korrekt gegen das Eingabearray gestreut (broadcasted).

Rückgabe:
Schiefendarray

Die Schiefe von Werten entlang einer Achse, gibt NaN zurück, wenn alle Werte gleich sind.

Hinweise

Die Stichproben-Schiefe wird als Fisher-Pearson-Schiefekoeffizient berechnet, d. h.

\[g_1=\frac{m_3}{m_2^{3/2}}\]

wo

\[m_i=\frac{1}{N}\sum_{n=1}^N(x[n]-\bar{x})^i\]

ist das verzerrte Stichproben-\(i\texttt{-te}\) zentrale Moment und \(\bar{x}\) ist der Stichprobenmittelwert. Wenn bias False ist, werden die Berechnungen auf Verzerrungen korrigiert und der berechnete Wert ist der angepasste Fisher-Pearson standardisierte Momentenkoeffizient, d. h.

\[G_1=\frac{k_3}{k_2^{3/2}}= \frac{\sqrt{N(N-1)}}{N-2}\frac{m_3}{m_2^{3/2}}.\]

Seit SciPy 1.9 werden np.matrix-Eingaben (für neuen Code nicht empfohlen) vor der Berechnung in np.ndarray konvertiert. In diesem Fall ist die Ausgabe eine Skalar- oder np.ndarray mit geeigneter Form anstelle eines 2D-np.matrix. Ebenso werden, während maskierte Elemente von Masked Arrays ignoriert werden, die Ausgabe eine Skalar- oder np.ndarray anstelle eines Masked Arrays mit mask=False sein.

skew hat experimentelle Unterstützung für Backends, die dem Python Array API Standard entsprechen, zusätzlich zu NumPy. Bitte erwägen Sie, diese Funktionen zu testen, indem Sie die Umgebungsvariable SCIPY_ARRAY_API=1 setzen und CuPy-, PyTorch-, JAX- oder Dask-Arrays als Array-Argumente bereitstellen. Die folgenden Kombinationen von Backend und Gerät (oder anderer Fähigkeit) werden unterstützt.

Bibliothek

CPU

GPU

NumPy

n/a

CuPy

n/a

PyTorch

JAX

⚠️ kein JIT

⚠️ kein JIT

Dask

⚠️ berechnet Graph

n/a

Siehe Unterstützung für den Array API Standard für weitere Informationen.

Referenzen

[1]

Zwillinger, D. und Kokoska, S. (2000). CRC Standard Probability and Statistics Tables and Formulae. Chapman & Hall: New York. 2000. Abschnitt 2.2.24.1

Beispiele

>>> from scipy.stats import skew
>>> skew([1, 2, 3, 4, 5])
0.0
>>> skew([2, 8, 0, 4, 1, 9, 9, 0])
0.2650554122698573