Chi-Quadrat-Test#

Der Chi-Quadrat-Test prüft die Nullhypothese, dass eine gegebene Menge kategorialer Daten die gegebenen Häufigkeiten aufweist.

In [1] wurde das Fressverhalten von Vögeln in einem alten Wald in Oregon untersucht. Im Wald waren 44 % des Kronenvolumens Douglasie, 24 % Ponderosa-Kiefer, 29 % Grand-Tanne und 3 % Westamerikanische Lärche. Die Autoren beobachteten das Verhalten mehrerer Vogelarten, darunter der Rotbrustkleiber. Sie machten 189 Beobachtungen dieser Art beim Fressen, davon 43 („23 %“) in Douglasien, 52 („28 %“) in Ponderosa-Kiefern, 54 („29 %“) in Grand-Tannen und 40 („21 %“) in Westamerikanischen Lärchen.

Mithilfe eines Chi-Quadrat-Tests können wir die Nullhypothese prüfen, dass die Anteile der Fressereignisse den Anteilen des Kronenvolumens entsprechen. Die Autoren der Arbeit betrachteten einen p-Wert kleiner als 1 % als signifikant.

Anhand der oben genannten Anteile des Kronenvolumens und der beobachteten Ereignisse können wir erwartete Häufigkeiten ableiten.

import numpy as np
f_exp = np.array([44, 24, 29, 3]) / 100 * 189

Die beobachteten Häufigkeiten des Fressens waren

f_obs = np.array([43, 52, 54, 40])

Wir können nun die beobachteten Häufigkeiten mit den erwarteten Häufigkeiten vergleichen.

from scipy.stats import chisquare
chisquare(f_obs=f_obs, f_exp=f_exp)
Power_divergenceResult(statistic=np.float64(228.23515947653874), pvalue=np.float64(3.3295585338846486e-49))

Der p-Wert liegt deutlich unter dem gewählten Signifikanzniveau. Daher betrachteten die Autoren den Unterschied als signifikant und schlossen, dass die relativen Anteile der Fressereignisse nicht mit den relativen Anteilen des Baumkronenvolumens übereinstimmten.

Referenzen#