kruskal#
- scipy.stats.kruskal(※samples, nan_policy='propagate', axis=0, keepdims=False)[Quelle]#
Berechnet den Kruskal-Wallis H-Test für unabhängige Stichproben.
Der Kruskal-Wallis H-Test prüft die Nullhypothese, dass die Populationsmediane aller Gruppen gleich sind. Es ist eine nichtparametrische Version der ANOVA. Der Test arbeitet mit 2 oder mehr unabhängigen Stichproben, die unterschiedliche Größen haben können. Beachten Sie, dass die Ablehnung der Nullhypothese nicht angibt, welche der Gruppen sich unterscheidet. Post-hoc-Vergleiche zwischen den Gruppen sind erforderlich, um festzustellen, welche Gruppen sich unterscheiden.
- Parameter:
- stichprobe1, stichprobe2, …array_like
Zwei oder mehr Arrays mit den Stichprobenmessungen können als Argumente angegeben werden. Stichproben müssen eindimensional sein.
- nan_policy{‘propagate’, ‘omit’, ‘raise’}
Definiert, wie Eingabe-NaNs behandelt werden.
propagate: Wenn ein NaN in der Achsen-Slice (z. B. Zeile) vorhanden ist, entlang der die Statistik berechnet wird, wird der entsprechende Eintrag der Ausgabe NaN sein.omit: NaNs werden bei der Berechnung weggelassen. Wenn im Achsen-Slice, entlang dem die Statistik berechnet wird, nicht genügend Daten verbleiben, wird der entsprechende Eintrag der Ausgabe NaN sein.raise: Wenn ein NaN vorhanden ist, wird einValueErrorausgelöst.
- axisint oder None, Standard: 0
Wenn es sich um eine ganze Zahl handelt, ist dies die Achse des Eingabearrays, entlang der die Statistik berechnet wird. Die Statistik jedes Achsen-Slices (z. B. Zeile) der Eingabe erscheint dann in einem entsprechenden Element der Ausgabe. Wenn
None, wird die Eingabe vor der Berechnung der Statistik geglättet.- keepdimsbool, Standard: False
Wenn dies auf True gesetzt ist, bleiben die reduzierten Achsen im Ergebnis als Dimensionen mit der Größe eins erhalten. Mit dieser Option wird das Ergebnis korrekt gegen das Eingabearray gestreut (broadcasted).
- Rückgabe:
- statisticfloat
Die Kruskal-Wallis H-Statistik, korrigiert für Bindungen.
- pvaluefloat
Der p-Wert für den Test unter der Annahme, dass H eine Chi-Quadrat-Verteilung hat. Der zurückgegebene p-Wert ist die Überlebensfunktion der Chi-Quadrat-Verteilung, ausgewertet an H.
Siehe auch
f_oneway1-Wege-ANOVA.
mannwhitneyuMann-Whitney-Rangtest für zwei Stichproben.
friedmanchisquareFriedman-Test für wiederholte Messungen.
Hinweise
Aufgrund der Annahme, dass H eine Chi-Quadrat-Verteilung hat, darf die Anzahl der Stichproben in jeder Gruppe nicht zu klein sein. Eine typische Regel ist, dass jede Stichprobe mindestens 5 Messungen enthalten muss.
Seit SciPy 1.9 werden
np.matrix-Eingaben (für neuen Code nicht empfohlen) vor der Berechnung innp.ndarraykonvertiert. In diesem Fall ist die Ausgabe eine Skalar- odernp.ndarraymit geeigneter Form anstelle eines 2D-np.matrix. Ebenso werden, während maskierte Elemente von Masked Arrays ignoriert werden, die Ausgabe eine Skalar- odernp.ndarrayanstelle eines Masked Arrays mitmask=Falsesein.Referenzen
[1]W. H. Kruskal & W. W. Wallis, „Use of Ranks in One-Criterion Variance Analysis“, Journal of the American Statistical Association, Bd. 47, Ausgabe 260, S. 583–621, 1952.
Beispiele
>>> from scipy import stats >>> x = [1, 3, 5, 7, 9] >>> y = [2, 4, 6, 8, 10] >>> stats.kruskal(x, y) KruskalResult(statistic=0.2727272727272734, pvalue=0.6015081344405895)
>>> x = [1, 1, 1] >>> y = [2, 2, 2] >>> z = [2, 2] >>> stats.kruskal(x, y, z) KruskalResult(statistic=7.0, pvalue=0.0301973834223185)