association#
- scipy.stats.contingency.association(observed, method='cramer', correction=False, lambda_=None)[Quelle]#
Berechnet den Grad der Assoziation zwischen zwei nominalen Variablen.
Die Funktion bietet die Möglichkeit, eine von drei Assoziationsmaßen zwischen zwei nominalen Variablen aus den Daten einer 2D-Kontingenztafel zu berechnen: Tschuprows T, Pearsons Kontingenzkoeffizient und Cramers V.
- Parameter:
- observedarray-ähnlich
Das Array der beobachteten Werte
- method{„cramer“, „tschuprow“, „pearson“} (Standard = „cramer“)
Die Assoziationsteststatistik.
- correctionbool, optional
Geerbt von scipy.stats.contingency.chi2_contingency()
- lambda_float oder str, optional
Geerbt von scipy.stats.contingency.chi2_contingency()
- Rückgabe:
- statisticfloat
Wert der Teststatistik
Hinweise
Cramers V, Tschuprows T und Pearsons Kontingenzkoeffizient messen alle den Grad, in dem zwei nominale oder ordinale Variablen miteinander zusammenhängen, oder das Ausmaß ihrer Assoziation. Dies unterscheidet sich von der Korrelation, obwohl viele sie fälschlicherweise als gleichwertig betrachten. Korrelation misst, auf welche Weise zwei Variablen zusammenhängen, während Assoziation misst, wie stark die Variablen zusammenhängen. Als solches schließt Assoziation keine unabhängigen Variablen ein und ist eher ein Test auf Unabhängigkeit. Ein Wert von 1,0 bedeutet perfekte Assoziation, und 0,0 bedeutet, dass die Variablen keine Assoziation aufweisen.
Sowohl Cramers V als auch Tschuprows T sind Erweiterungen des Phi-Koeffizienten. Darüber hinaus können aufgrund der engen Beziehung zwischen Cramers V und Tschuprows T die zurückgegebenen Werte oft ähnlich oder sogar gleich sein. Sie werden wahrscheinlich stärker divergieren, wenn die Form des Arrays von einem 2x2 abweicht.
Referenzen
[1]„Tschuprows T“, https://en.wikipedia.org/wiki/Tschuprow’s_T
[2]Tschuprow, A. A. (1939) Principles of the Mathematical Theory of Correlation; übersetzt von M. Kantorowitsch. W. Hodge & Co.
[3]„Cramers V“, https://en.wikipedia.org/wiki/Cramer’s_V
[4]„Nominal Association: Phi and Cramer’s V“, http://www.people.vcu.edu/~pdattalo/702SuppRead/MeasAssoc/NominalAssoc.html
[5]Gingrich, Paul, „Association Between Variables“, http://uregina.ca/~gingrich/ch11a.pdf
Beispiele
Ein Beispiel mit einer 4x2-Kontingenztafel
>>> import numpy as np >>> from scipy.stats.contingency import association >>> obs4x2 = np.array([[100, 150], [203, 322], [420, 700], [320, 210]])
Pearsons Kontingenzkoeffizient
>>> association(obs4x2, method="pearson") 0.18303298140595667
Cramers V
>>> association(obs4x2, method="cramer") 0.18617813077483678
Tschuprows T
>>> association(obs4x2, method="tschuprow") 0.14146478765062995