scipy.stats.mstats.

spearmanr#

scipy.stats.mstats.spearmanr(x, y=None, use_ties=True, axis=None, nan_policy='propagate', alternative='two-sided')[Quellcode]#

Berechnet einen Spearman-Rangkorrelationskoeffizienten und den p-Wert, um auf Nichtkorrelation zu testen.

Die Spearman-Korrelation ist ein nichtparametrisches Maß für die lineare Beziehung zwischen zwei Datensätzen. Im Gegensatz zur Pearson-Korrelation wird bei der Spearman-Korrelation nicht davon ausgegangen, dass beide Datensätze normalverteilt sind. Wie andere Korrelationskoeffizienten variiert dieser zwischen -1 und +1, wobei 0 keine Korrelation bedeutet. Korrelationen von -1 oder +1 implizieren eine monotone Beziehung. Positive Korrelationen bedeuten, dass mit steigendem x auch y steigt. Negative Korrelationen bedeuten, dass mit steigendem x y sinkt.

Fehlende Werte werden paarweise verworfen: Wenn ein Wert in x fehlt, wird der entsprechende Wert in y maskiert.

Der p-Wert gibt ungefähr die Wahrscheinlichkeit an, dass ein unkorreliertes System Datensätze erzeugt, die eine Spearman-Korrelation aufweisen, die mindestens so extrem ist wie die aus diesen Datensätzen berechnete. Die p-Werte sind nicht vollständig zuverlässig, aber für Datensätze mit mehr als etwa 500 Einträgen wahrscheinlich vernünftig.

Parameter:
x, y1D oder 2D array_like, y ist optional

Ein oder zwei 1D- oder 2D-Arrays, die mehrere Variablen und Beobachtungen enthalten. Wenn diese 1D sind, repräsentiert jedes eine Vektor von Beobachtungen einer einzelnen Variablen. Für das Verhalten im 2D-Fall siehe unter axis unten.

use_tiesbool, optional

NICHT VERWENDEN. Tut nichts, das Schlüsselwort bleibt nur aus Gründen der Abwärtskompatibilität erhalten.

axisint oder None, optional

Wenn axis=0 (Standard), dann stellt jede Spalte eine Variable dar, mit Beobachtungen in den Zeilen. Wenn axis=1, wird die Beziehung umgekehrt: Jede Zeile stellt eine Variable dar, während die Spalten Beobachtungen enthalten. Wenn axis=None, werden beide Arrays zu einem Vektor verflacht.

nan_policy{‘propagate’, ‘raise’, ‘omit’}, optional

Definiert, wie mit Eingaben umgegangen wird, die nan enthalten. 'propagate' gibt nan zurück, 'raise' wirft einen Fehler, 'omit' führt die Berechnungen durch und ignoriert nan-Werte. Standard ist 'propagate'.

alternative{‘zweiseitig’, ‘kleiner’, ‘größer’}, optional

Definiert die Alternativhypothese. Standard ist ‘zweiseitig’. Folgende Optionen sind verfügbar

  • ‘two-sided’: die Korrelation ist ungleich Null

  • ‘less’: die Korrelation ist negativ (kleiner als Null)

  • ‘greater’: die Korrelation ist positiv (größer als Null)

Hinzugefügt in Version 1.7.0.

Rückgabe:
resSignificanceResult

Ein Objekt, das Attribute enthält

statisticfloat oder ndarray (2D quadratisch)

Spearman-Korrelationsmatrix oder Korrelationskoeffizient (wenn nur 2 Variablen als Parameter angegeben sind). Die Korrelationsmatrix ist quadratisch mit einer Länge, die der Gesamtzahl der Variablen (Spalten oder Zeilen) in a und b entspricht.

pvaluefloat

Der p-Wert für einen Hypothesentest, dessen Nullhypothese lautet, dass zwei Datensätze linear unkorreliert sind. Siehe alternative oben für alternative Hypothesen. pvalue hat die gleiche Form wie statistic.

Referenzen

[CRCProbStat2000] Abschnitt 14.7