scipy.stats.

boschloo_exact#

scipy.stats.boschloo_exact(table, alternative='two-sided', n=32)[Quelle]#

Führt den exakten Boschloo-Test für eine 2x2-Kontingenztafel durch.

Parameter:
tablearray_like von ints

Eine 2x2-Kontingenztafel. Die Elemente sollten nicht-negative ganze Zahlen sein.

alternative{‘zweiseitig’, ‘kleiner’, ‘größer’}, optional

Definiert die Null- und Alternativhypothesen. Standard ist 'two-sided'. Bitte siehe Erklärungen im Abschnitt Anmerkungen unten.

nint, optional

Anzahl der Stichprobenpunkte, die bei der Konstruktion der Stichprobenmethode verwendet werden. Beachten Sie, dass dieses Argument automatisch in die nächste höhere Zweierpotenz umgewandelt wird, da scipy.stats.qmc.Sobol zur Auswahl von Stichprobenpunkten verwendet wird. Standard ist 32. Muss positiv sein. In den meisten Fällen reichen 32 Punkte aus, um eine gute Genauigkeit zu erzielen. Mehr Punkte gehen zu Lasten der Leistung.

Rückgabe:
RückgabeBoschlooExactResult

Ein Ergebnisobjekt mit folgenden Attributen.

statisticfloat

Die Statistik, die im Boschloo-Test verwendet wird; d. h. der p-Wert des exakten Fisher-Tests.

pvaluefloat

p-Wert, die Wahrscheinlichkeit, eine Verteilung zu erhalten, die mindestens so extrem ist wie die tatsächlich beobachtete, unter der Annahme, dass die Nullhypothese wahr ist.

Siehe auch

chi2_contingency

Chi-Quadrat-Test auf Unabhängigkeit von Variablen in einer Kontingenztafel.

fisher_exact

Fisher-Exakttest für eine 2x2-Kontingenztafel.

barnard_exact

Barnard's exakter Test, der eine leistungsfähigere Alternative zum exakten Fisher-Test für 2x2-Kontingenztafeln darstellt.

Hinweise

Boschloo's Test ist ein exakter Test zur Analyse von Kontingenztafeln. Er untersucht den Zusammenhang zwischen zwei kategorialen Variablen und ist eine gleichmäßig leistungsfähigere Alternative zum exakten Fisher-Test für 2x2-Kontingenztafeln.

Boschloo's exakter Test verwendet den p-Wert des exakten Fisher-Tests als Statistik, und Boschloo's p-Wert ist die Wahrscheinlichkeit unter der Nullhypothese, einen derart extremen Wert dieser Statistik zu beobachten.

Definieren wir \(X_0\) als eine 2x2-Matrix, die die beobachtete Stichprobe darstellt, wobei jede Spalte das binomiale Experiment speichert, wie im folgenden Beispiel. Definieren wir auch \(p_1, p_2\) als die theoretischen binomialen Wahrscheinlichkeiten für \(x_{11}\) und \(x_{12}\). Bei Verwendung des exakten Boschloo-Tests können wir drei verschiedene Alternativhypothesen aufstellen:

  • \(H_0 : p_1=p_2\) versus \(H_1 : p_1 < p_2\), mit alternative = “less”

  • \(H_0 : p_1=p_2\) versus \(H_1 : p_1 > p_2\), mit alternative = “greater”

  • \(H_0 : p_1=p_2\) versus \(H_1 : p_1 \neq p_2\), mit alternative = “two-sided” (Standard)

Es gibt mehrere Konventionen zur Berechnung eines zweiseitigen p-Werts, wenn die Nullverteilung asymmetrisch ist. Hier wenden wir die Konvention an, dass der p-Wert eines zweiseitigen Tests das Doppelte des Minimums der p-Werte der einseitigen Tests ist (begrenzt auf 1.0). Beachten Sie, dass fisher_exact einer anderen Konvention folgt. Daher kann die von boschloo_exact berichtete Statistik für eine gegebene table vom p-Wert abweichen, der von fisher_exact berichtet wird, wenn alternative='two-sided' ist.

Hinzugefügt in Version 1.7.0.

Referenzen

[1]

R.D. Boschloo. "Raised conditional level of significance for the 2 x 2-table when testing the equality of two probabilities", Statistica Neerlandica, 24(1), 1970

[2]

“Boschloo’s test”, Wikipedia, https://en.wikipedia.org/wiki/Boschloo%27s_test

[3]

Lise M. Saari et al. “Employee attitudes and job satisfaction”, Human Resource Management, 43(4), 395-407, 2004, DOI:10.1002/hrm.20032.

Beispiele

Im folgenden Beispiel betrachten wir den Artikel „Employee attitudes and job satisfaction“ [3], der die Ergebnisse einer Umfrage unter 63 Wissenschaftlern und 117 College-Professoren berichtet. Von den 63 Wissenschaftlern gaben 31 an, mit ihrem Beruf sehr zufrieden zu sein, während 74 der College-Professoren mit ihrer Arbeit sehr zufrieden waren. Gibt es signifikante Beweise dafür, dass College-Professoren mit ihrer Arbeit glücklicher sind als Wissenschaftler? Die folgende Tabelle fasst die oben genannten Daten zusammen:

                 college professors   scientists
Very Satisfied   74                     31
Dissatisfied     43                     32

Wenn wir mit statistischen Hypothesentests arbeiten, verwenden wir normalerweise eine Schwellenwahrscheinlichkeit oder ein Signifikanzniveau, auf dessen Grundlage wir entscheiden, die Nullhypothese \(H_0\) abzulehnen. Nehmen wir an, wir wählen das übliche Signifikanzniveau von 5 %.

Unsere Alternativhypothese ist, dass College-Professoren mit ihrer Arbeit wirklich zufriedener sind als Wissenschaftler. Daher erwarten wir, dass \(p_1\), der Anteil der sehr zufriedenen College-Professoren, größer ist als \(p_2\), der Anteil der sehr zufriedenen Wissenschaftler. Wir rufen daher boschloo_exact mit der Option alternative="greater" auf.

>>> import scipy.stats as stats
>>> res = stats.boschloo_exact([[74, 31], [43, 32]], alternative="greater")
>>> res.statistic
0.0483
>>> res.pvalue
0.0355

Unter der Nullhypothese, dass Wissenschaftler mit ihrer Arbeit glücklicher sind als College-Professoren, beträgt die Wahrscheinlichkeit, Testergebnisse zu erhalten, die mindestens so extrem sind wie die beobachteten Daten, etwa 3,55 %. Da dieser p-Wert kleiner ist als unser gewähltes Signifikanzniveau, haben wir Beweise, um \(H_0\) zugunsten der Alternativhypothese abzulehnen.