scipy.stats.contingency.

relative_risk#

scipy.stats.contingency.relative_risk(exposed_cases, exposed_total, control_cases, control_total)[Quelle]#

Berechnet das relative Risiko (auch bekannt als Risikoquotient).

Diese Funktion berechnet das relative Risiko, das mit einer 2x2-Kontingenztafel verbunden ist ([1], Abschnitt 2.2.3; [2], Abschnitt 3.1.2). Anstatt eine Tabelle als Argument zu akzeptieren, werden die einzelnen Zahlen, die zur Berechnung des relativen Risikos verwendet werden, als separate Parameter angegeben. Dies dient dazu, die Mehrdeutigkeit zu vermeiden, welche Zeile oder Spalte der Kontingenztafel zu den "exponierten" Fällen und welche zu den "Kontroll"-Fällen gehört. Im Gegensatz zum Chancenverhältnis beispielsweise ist das relative Risiko nicht invariant gegenüber einem Vertauschen der Zeilen oder Spalten.

Parameter:
exposed_casesnicht-negative ganze Zahl

Die Anzahl der "Fälle" (d. h. das Auftreten von Krankheiten oder anderen interessierenden Ereignissen) bei der Stichprobe der "exponierten" Personen.

exposed_totalpositive ganze Zahl

Die Gesamtzahl der "exponierten" Personen in der Stichprobe.

control_casesnicht-negative ganze Zahl

Die Anzahl der "Fälle" bei der Stichprobe der "Kontroll"- oder nicht exponierten Personen.

control_totalpositive ganze Zahl

Die Gesamtzahl der "Kontroll"-Personen in der Stichprobe.

Rückgabe:
resultInstanz von RelativeRiskResult

Das Objekt hat das Float-Attribut relative_risk, das

rr = (exposed_cases/exposed_total) / (control_cases/control_total)

Das Objekt hat auch die Methode confidence_interval, um das Konfidenzintervall des relativen Risikos für ein gegebenes Konfidenzniveau zu berechnen.

Siehe auch

odds_ratio

Hinweise

Das R-Paket epitools hat die Funktion riskratio, die eine Tabelle mit folgendem Layout akzeptiert

                disease=0   disease=1
exposed=0 (ref)    n00         n01
exposed=1          n10         n11

Mit einer 2x2-Tabelle im obigen Format wird die Schätzung des KI von riskratio berechnet, wenn das Argument method="wald" angegeben ist, oder mit der Funktion riskratio.wald.

Beispielsweise bei einem Test auf das Auftreten von Lungenkrebs bei einer Stichprobe von Rauchern und Nichtrauchern würde die Kategorie "exponiert" "Raucher sein" entsprechen und die Kategorie "Krankheit" "Lungenkrebs haben oder gehabt haben" entsprechen.

Um dieselben Daten an relative_risk zu übergeben, verwenden Sie

relative_risk(n11, n10 + n11, n01, n00 + n01)

Hinzugefügt in Version 1.7.0.

Referenzen

[1]

Alan Agresti, An Introduction to Categorical Data Analysis (zweite Auflage), Wiley, Hoboken, NJ, USA (2007).

[2] (1,2)

Hardeo Sahai und Anwer Khurshid, Statistics in Epidemiology, CRC Press LLC, Boca Raton, FL, USA (1996).

Beispiele

>>> from scipy.stats.contingency import relative_risk

Dieses Beispiel stammt aus Beispiel 3.1 von [2]. Die Ergebnisse einer Herzstudie werden in der folgenden Tabelle zusammengefasst

         High CAT   Low CAT    Total
         --------   -------    -----
CHD         27         44        71
No CHD      95        443       538

Total      122        487       609

CHD ist Koronare Herzkrankheit (Coronary Heart Disease), und CAT bezieht sich auf den Spiegel der zirkulierenden Katecholamine. CAT ist die "Expositions"-Variable, und hohes CAT ist die "exponierte" Kategorie. Die Daten aus der Tabelle, die an relative_risk übergeben werden sollen, sind also

exposed_cases = 27
exposed_total = 122
control_cases = 44
control_total = 487
>>> result = relative_risk(27, 122, 44, 487)
>>> result.relative_risk
2.4495156482861398

Finden Sie das Konfidenzintervall für das relative Risiko.

>>> result.confidence_interval(confidence_level=0.95)
ConfidenceInterval(low=1.5836990926700116, high=3.7886786315466354)

Das Intervall enthält nicht 1, daher unterstützen die Daten die Aussage, dass hohes CAT mit einem größeren Risiko für CHD verbunden ist.