boschloo_exact#
- scipy.stats.boschloo_exact(table, alternative='two-sided', n=32)[Quelle]#
Führt den exakten Boschloo-Test für eine 2x2-Kontingenztafel durch.
- Parameter:
- tablearray_like von ints
Eine 2x2-Kontingenztafel. Die Elemente sollten nicht-negative ganze Zahlen sein.
- alternative{‘zweiseitig’, ‘kleiner’, ‘größer’}, optional
Definiert die Null- und Alternativhypothesen. Standard ist 'two-sided'. Bitte siehe Erklärungen im Abschnitt Anmerkungen unten.
- nint, optional
Anzahl der Stichprobenpunkte, die bei der Konstruktion der Stichprobenmethode verwendet werden. Beachten Sie, dass dieses Argument automatisch in die nächste höhere Zweierpotenz umgewandelt wird, da
scipy.stats.qmc.Sobolzur Auswahl von Stichprobenpunkten verwendet wird. Standard ist 32. Muss positiv sein. In den meisten Fällen reichen 32 Punkte aus, um eine gute Genauigkeit zu erzielen. Mehr Punkte gehen zu Lasten der Leistung.
- Rückgabe:
- RückgabeBoschlooExactResult
Ein Ergebnisobjekt mit folgenden Attributen.
- statisticfloat
Die Statistik, die im Boschloo-Test verwendet wird; d. h. der p-Wert des exakten Fisher-Tests.
- pvaluefloat
p-Wert, die Wahrscheinlichkeit, eine Verteilung zu erhalten, die mindestens so extrem ist wie die tatsächlich beobachtete, unter der Annahme, dass die Nullhypothese wahr ist.
Siehe auch
chi2_contingencyChi-Quadrat-Test auf Unabhängigkeit von Variablen in einer Kontingenztafel.
fisher_exactFisher-Exakttest für eine 2x2-Kontingenztafel.
barnard_exactBarnard's exakter Test, der eine leistungsfähigere Alternative zum exakten Fisher-Test für 2x2-Kontingenztafeln darstellt.
Hinweise
Boschloo's Test ist ein exakter Test zur Analyse von Kontingenztafeln. Er untersucht den Zusammenhang zwischen zwei kategorialen Variablen und ist eine gleichmäßig leistungsfähigere Alternative zum exakten Fisher-Test für 2x2-Kontingenztafeln.
Boschloo's exakter Test verwendet den p-Wert des exakten Fisher-Tests als Statistik, und Boschloo's p-Wert ist die Wahrscheinlichkeit unter der Nullhypothese, einen derart extremen Wert dieser Statistik zu beobachten.
Definieren wir \(X_0\) als eine 2x2-Matrix, die die beobachtete Stichprobe darstellt, wobei jede Spalte das binomiale Experiment speichert, wie im folgenden Beispiel. Definieren wir auch \(p_1, p_2\) als die theoretischen binomialen Wahrscheinlichkeiten für \(x_{11}\) und \(x_{12}\). Bei Verwendung des exakten Boschloo-Tests können wir drei verschiedene Alternativhypothesen aufstellen:
\(H_0 : p_1=p_2\) versus \(H_1 : p_1 < p_2\), mit alternative = “less”
\(H_0 : p_1=p_2\) versus \(H_1 : p_1 > p_2\), mit alternative = “greater”
\(H_0 : p_1=p_2\) versus \(H_1 : p_1 \neq p_2\), mit alternative = “two-sided” (Standard)
Es gibt mehrere Konventionen zur Berechnung eines zweiseitigen p-Werts, wenn die Nullverteilung asymmetrisch ist. Hier wenden wir die Konvention an, dass der p-Wert eines zweiseitigen Tests das Doppelte des Minimums der p-Werte der einseitigen Tests ist (begrenzt auf 1.0). Beachten Sie, dass
fisher_exacteiner anderen Konvention folgt. Daher kann die vonboschloo_exactberichtete Statistik für eine gegebene table vom p-Wert abweichen, der vonfisher_exactberichtet wird, wennalternative='two-sided'ist.Hinzugefügt in Version 1.7.0.
Referenzen
[1]R.D. Boschloo. "Raised conditional level of significance for the 2 x 2-table when testing the equality of two probabilities", Statistica Neerlandica, 24(1), 1970
[2]“Boschloo’s test”, Wikipedia, https://en.wikipedia.org/wiki/Boschloo%27s_test
[3]Lise M. Saari et al. “Employee attitudes and job satisfaction”, Human Resource Management, 43(4), 395-407, 2004, DOI:10.1002/hrm.20032.
Beispiele
Im folgenden Beispiel betrachten wir den Artikel „Employee attitudes and job satisfaction“ [3], der die Ergebnisse einer Umfrage unter 63 Wissenschaftlern und 117 College-Professoren berichtet. Von den 63 Wissenschaftlern gaben 31 an, mit ihrem Beruf sehr zufrieden zu sein, während 74 der College-Professoren mit ihrer Arbeit sehr zufrieden waren. Gibt es signifikante Beweise dafür, dass College-Professoren mit ihrer Arbeit glücklicher sind als Wissenschaftler? Die folgende Tabelle fasst die oben genannten Daten zusammen:
college professors scientists Very Satisfied 74 31 Dissatisfied 43 32
Wenn wir mit statistischen Hypothesentests arbeiten, verwenden wir normalerweise eine Schwellenwahrscheinlichkeit oder ein Signifikanzniveau, auf dessen Grundlage wir entscheiden, die Nullhypothese \(H_0\) abzulehnen. Nehmen wir an, wir wählen das übliche Signifikanzniveau von 5 %.
Unsere Alternativhypothese ist, dass College-Professoren mit ihrer Arbeit wirklich zufriedener sind als Wissenschaftler. Daher erwarten wir, dass \(p_1\), der Anteil der sehr zufriedenen College-Professoren, größer ist als \(p_2\), der Anteil der sehr zufriedenen Wissenschaftler. Wir rufen daher
boschloo_exactmit der Optionalternative="greater"auf.>>> import scipy.stats as stats >>> res = stats.boschloo_exact([[74, 31], [43, 32]], alternative="greater") >>> res.statistic 0.0483 >>> res.pvalue 0.0355
Unter der Nullhypothese, dass Wissenschaftler mit ihrer Arbeit glücklicher sind als College-Professoren, beträgt die Wahrscheinlichkeit, Testergebnisse zu erhalten, die mindestens so extrem sind wie die beobachteten Daten, etwa 3,55 %. Da dieser p-Wert kleiner ist als unser gewähltes Signifikanzniveau, haben wir Beweise, um \(H_0\) zugunsten der Alternativhypothese abzulehnen.