Vergleich zweier Stichproben#
Im Folgenden werden zwei Stichproben gegeben, die entweder aus derselben oder aus unterschiedlichen Verteilungen stammen können, und wir möchten testen, ob diese Stichproben dieselben statistischen Eigenschaften aufweisen.
Vergleich von Mittelwerten#
Test mit Stichproben mit identischen Mittelwerten
>>> import scipy.stats as stats
>>> rvs1 = stats.norm.rvs(loc=5, scale=10, size=500)
>>> rvs2 = stats.norm.rvs(loc=5, scale=10, size=500)
>>> stats.ttest_ind(rvs1, rvs2)
Ttest_indResult(statistic=-0.5489036175088705, pvalue=0.5831943748663959) # random
Test mit Stichproben mit unterschiedlichen Mittelwerten
>>> rvs3 = stats.norm.rvs(loc=8, scale=10, size=500)
>>> stats.ttest_ind(rvs1, rvs3)
Ttest_indResult(statistic=-4.533414290175026, pvalue=6.507128186389019e-06) # random
Kolmogorov-Smirnov-Test für zwei Stichproben ks_2samp#
Für das Beispiel, bei dem beide Stichproben aus derselben Verteilung gezogen werden, können wir die Nullhypothese nicht verwerfen, da der p-Wert hoch ist.
>>> stats.ks_2samp(rvs1, rvs2)
KstestResult(statistic=0.026, pvalue=0.9959527565364388) # random
Im zweiten Beispiel mit unterschiedlicher Lage, d.h. unterschiedlichen Mittelwerten, können wir die Nullhypothese verwerfen, da der p-Wert unter 1% liegt.
>>> stats.ks_2samp(rvs1, rvs3)
KstestResult(statistic=0.114, pvalue=0.00299005061044668) # random