bws_test#
- scipy.stats.bws_test(x, y, *, alternative='two-sided', method=None)[Quelle]#
Führt den Baumgartner-Weiss-Schindler-Test für zwei unabhängige Stichproben durch.
Der Baumgartner-Weiss-Schindler (BWS)-Test ist ein nichtparametrischer Test der Nullhypothese, dass die Stichprobe x und die Stichprobe y aus derselben zugrundeliegenden Verteilung stammen. Im Gegensatz zu den Kolmogorov-Smirnov-, Wilcoxon- und Cramer-Von-Mises-Tests gewichtet der BWS-Test das Integral mit der Varianz der Differenz der kumulativen Verteilungsfunktionen (CDFs), wodurch die Enden der Verteilungen betont werden, was die Aussagekraft des Tests in vielen Anwendungen erhöht.
- Parameter:
- x, yarray-ähnlich
1D-Arrays von Stichproben.
- alternative{‘zweiseitig’, ‘kleiner’, ‘größer’}, optional
Definiert die alternative Hypothese. Standard ist 'zweiseitig'. Seien F(u) und G(u) die kumulativen Verteilungsfunktionen der Verteilungen, die den Stichproben x und y zugrunde liegen. Dann sind die folgenden alternativen Hypothesen verfügbar:
‘zweiseitig’: Die Verteilungen sind nicht gleich, d.h. F(u) ≠ G(u) für mindestens ein u.
‘kleiner’: Die Verteilung, die der Stichprobe x zugrunde liegt, ist stochastisch kleiner als die Verteilung, die der Stichprobe y zugrunde liegt, d.h. F(u) >= G(u) für alle u.
‘größer’: Die Verteilung, die der Stichprobe x zugrunde liegt, ist stochastisch größer als die Verteilung, die der Stichprobe y zugrunde liegt, d.h. F(u) <= G(u) für alle u.
Unter einer restriktiveren Annahmenmenge können die alternativen Hypothesen in Bezug auf die Lagen der Verteilungen ausgedrückt werden; siehe [2] Abschnitt 5.1.
- methodPermutationMethod, optional
Konfiguriert die Methode zur Berechnung des p-Wertes. Standard ist das Standardobjekt
PermutationMethod.
- Rückgabe:
- resPermutationTestResult
- Ein Objekt mit den Attributen
- statisticfloat
Die beobachtete Teststatistik der Daten.
- pvaluefloat
Der p-Wert für die gegebene Alternative.
- null_distributionndarray
Die Werte der Teststatistik, die unter der Nullhypothese generiert wurden.
Hinweise
Wenn
alternative=='zweiseitig', ist die Statistik definiert durch die Gleichungen in [1] Abschnitt 2. Diese Statistik ist für einseitige Alternativen nicht geeignet; in diesem Fall ist die Statistik das *Negative* der in [1] Abschnitt 2 angegebenen Statistik. Folglich wird die Statistik tendenziell positiv sein, wenn die Verteilung der ersten Stichprobe stochastisch größer ist als die der zweiten Stichprobe.Referenzen
[1] (1,2,3,4,5)Neuhäuser, M. (2005). Exact Tests Based on the Baumgartner-Weiss-Schindler Statistic: A Survey. Statistical Papers, 46(1), 1-29.
[2]Fay, M. P. & Proschan, M. A. (2010). Wilcoxon-Mann-Whitney oder t-Test? Über Annahmen für Hypothesentests und multiple Interpretationen von Entscheidungsregeln. Statistics surveys, 4, 1.
Beispiele
Wir folgen dem Beispiel von Tabelle 3 in [1]: Vierzehn Kinder wurden zufällig in zwei Gruppen eingeteilt. Ihre Ränge bei der Ausführung eines bestimmten Tests sind wie folgt.
>>> import numpy as np >>> x = [1, 2, 3, 4, 6, 7, 8] >>> y = [5, 9, 10, 11, 12, 13, 14]
Wir verwenden den BWS-Test, um festzustellen, ob es einen statistisch signifikanten Unterschied zwischen den beiden Gruppen gibt. Die Nullhypothese besagt, dass es keinen Unterschied in den Verteilungen der Leistung zwischen den beiden Gruppen gibt. Wir legen fest, dass ein Signifikanzniveau von 1% erforderlich ist, um die Nullhypothese zugunsten der Alternative zu verwerfen, dass die Verteilungen unterschiedlich sind. Da die Anzahl der Stichproben sehr klein ist, können wir die beobachtete Teststatistik mit der *exakten* Verteilung der Teststatistik unter der Nullhypothese vergleichen.
>>> from scipy.stats import bws_test >>> res = bws_test(x, y) >>> print(res.statistic) 5.132167152575315
Dies stimmt mit dem in [1] berichteten Wert \(B = 5.132\) überein. Der von
bws_testerzeugte p-Wert stimmt ebenfalls mit dem in [1] berichteten Wert \(p = 0.0029\) überein.>>> print(res.pvalue) 0.002913752913752914
Da der p-Wert unter unserer Schwelle von 1 % liegt, betrachten wir dies als Beweis gegen die Nullhypothese zugunsten der Alternative, dass es einen Leistungsunterschied zwischen den beiden Gruppen gibt.