Vergleich zweier Stichproben#

Im Folgenden werden zwei Stichproben gegeben, die entweder aus derselben oder aus unterschiedlichen Verteilungen stammen können, und wir möchten testen, ob diese Stichproben dieselben statistischen Eigenschaften aufweisen.

Vergleich von Mittelwerten#

Test mit Stichproben mit identischen Mittelwerten

>>> import scipy.stats as stats
>>> rvs1 = stats.norm.rvs(loc=5, scale=10, size=500)
>>> rvs2 = stats.norm.rvs(loc=5, scale=10, size=500)
>>> stats.ttest_ind(rvs1, rvs2)
Ttest_indResult(statistic=-0.5489036175088705, pvalue=0.5831943748663959)  # random

Test mit Stichproben mit unterschiedlichen Mittelwerten

>>> rvs3 = stats.norm.rvs(loc=8, scale=10, size=500)
>>> stats.ttest_ind(rvs1, rvs3)
Ttest_indResult(statistic=-4.533414290175026, pvalue=6.507128186389019e-06)  # random

Kolmogorov-Smirnov-Test für zwei Stichproben ks_2samp#

Für das Beispiel, bei dem beide Stichproben aus derselben Verteilung gezogen werden, können wir die Nullhypothese nicht verwerfen, da der p-Wert hoch ist.

>>> stats.ks_2samp(rvs1, rvs2)
KstestResult(statistic=0.026, pvalue=0.9959527565364388)  # random

Im zweiten Beispiel mit unterschiedlicher Lage, d.h. unterschiedlichen Mittelwerten, können wir die Nullhypothese verwerfen, da der p-Wert unter 1% liegt.

>>> stats.ks_2samp(rvs1, rvs3)
KstestResult(statistic=0.114, pvalue=0.00299005061044668)  # random