epps_singleton_2samp#
- scipy.stats.epps_singleton_2samp(x, y, t=(0.4, 0.8), *, axis=0, nan_policy='propagate', keepdims=False)[Quelle]#
Berechnet die Epps-Singleton (ES) Teststatistik.
Testet die Nullhypothese, dass zwei Stichproben dieselbe zugrundeliegende Wahrscheinlichkeitsverteilung aufweisen.
- Parameter:
- x, yarray-ähnlich
Die beiden Stichproben von Beobachtungen, die getestet werden sollen. Die Eingabe darf nicht mehr als eine Dimension haben. Die Stichproben können unterschiedliche Längen haben, aber beide müssen mindestens fünf Beobachtungen enthalten.
- tarray-ähnlich, optional
Die Punkte (t1, …, tn), an denen die empirische charakteristische Funktion ausgewertet werden soll. Es sollten positive, unterschiedliche Zahlen sein. Der Standardwert (0.4, 0.8) wurde in [1] vorgeschlagen. Die Eingabe darf nicht mehr als eine Dimension haben.
- axisint oder None, Standard: 0
Wenn es sich um eine ganze Zahl handelt, ist dies die Achse des Eingabearrays, entlang der die Statistik berechnet wird. Die Statistik jedes Achsen-Slices (z. B. Zeile) der Eingabe erscheint dann in einem entsprechenden Element der Ausgabe. Wenn
None, wird die Eingabe vor der Berechnung der Statistik geglättet.- nan_policy{‘propagate’, ‘omit’, ‘raise’}
Definiert, wie Eingabe-NaNs behandelt werden.
propagate: Wenn ein NaN in der Achsen-Slice (z. B. Zeile) vorhanden ist, entlang der die Statistik berechnet wird, wird der entsprechende Eintrag der Ausgabe NaN sein.omit: NaNs werden bei der Berechnung weggelassen. Wenn im Achsen-Slice, entlang dem die Statistik berechnet wird, nicht genügend Daten verbleiben, wird der entsprechende Eintrag der Ausgabe NaN sein.raise: Wenn ein NaN vorhanden ist, wird einValueErrorausgelöst.
- keepdimsbool, Standard: False
Wenn dies auf True gesetzt ist, bleiben die reduzierten Achsen im Ergebnis als Dimensionen mit der Größe eins erhalten. Mit dieser Option wird das Ergebnis korrekt gegen das Eingabearray gestreut (broadcasted).
- Rückgabe:
- statisticfloat
Die Teststatistik.
- pvaluefloat
Der zugehörige p-Wert, basierend auf der asymptotischen Chi-Quadrat-Verteilung.
Siehe auch
Hinweise
Das Testen, ob zwei Stichproben aus derselben zugrundeliegenden Verteilung erzeugt wurden, ist eine klassische Fragestellung in der Statistik. Ein weit verbreiteter Test ist der Kolmogorov-Smirnov (KS) Test, der auf der empirischen Verteilungsfunktion basiert. Epps und Singleton führen in [1] einen Test basierend auf der empirischen charakteristischen Funktion ein.
Ein Vorteil des ES-Tests gegenüber dem KS-Test ist, dass er keine kontinuierliche Verteilung voraussetzt. In [1] kommen die Autoren zu dem Schluss, dass der Test in vielen Beispielen auch eine höhere Aussagekraft als der KS-Test aufweist. Sie empfehlen die Verwendung des ES-Tests sowohl für diskrete als auch für kontinuierliche Stichproben mit mindestens 25 Beobachtungen pro Stichprobe, während
anderson_ksampfür kleinere Stichprobengrößen im kontinuierlichen Fall empfohlen wird.Der p-Wert wird aus der asymptotischen Verteilung der Teststatistik berechnet, die einer
chi2-Verteilung folgt. Wenn die Stichprobengröße von sowohl x als auch y unter 25 liegt, wird die in [1] vorgeschlagene Korrektur für kleine Stichproben auf die Teststatistik angewendet.Die Standardwerte von
twerden in [1] durch die Betrachtung verschiedener Verteilungen und die Ermittlung guter Werte, die zu einer hohen Aussagekraft des Tests im Allgemeinen führen, bestimmt. Tabelle III in [1] gibt die optimalen Werte für die in dieser Studie getesteten Verteilungen an. Die Werte vontwerden in der Implementierung durch den halben Interquartilsabstand skaliert, siehe [1].Seit SciPy 1.9 werden
np.matrix-Eingaben (für neuen Code nicht empfohlen) vor der Berechnung innp.ndarraykonvertiert. In diesem Fall ist die Ausgabe eine Skalar- odernp.ndarraymit geeigneter Form anstelle eines 2D-np.matrix. Ebenso werden, während maskierte Elemente von Masked Arrays ignoriert werden, die Ausgabe eine Skalar- odernp.ndarrayanstelle eines Masked Arrays mitmask=Falsesein.Referenzen
[1] (1,2,3,4,5,6,7)T. W. Epps und K. J. Singleton, „An omnibus test for the two-sample problem using the empirical characteristic function“, Journal of Statistical Computation and Simulation 26, S. 177–203, 1986.
[2]S. J. Goerg und J. Kaiser, „Nonparametric testing of distributions - the Epps-Singleton two-sample test using the empirical characteristic function“, The Stata Journal 9(3), S. 454–465, 2009.