relative_risk#
- scipy.stats.contingency.relative_risk(exposed_cases, exposed_total, control_cases, control_total)[Quelle]#
Berechnet das relative Risiko (auch bekannt als Risikoquotient).
Diese Funktion berechnet das relative Risiko, das mit einer 2x2-Kontingenztafel verbunden ist ([1], Abschnitt 2.2.3; [2], Abschnitt 3.1.2). Anstatt eine Tabelle als Argument zu akzeptieren, werden die einzelnen Zahlen, die zur Berechnung des relativen Risikos verwendet werden, als separate Parameter angegeben. Dies dient dazu, die Mehrdeutigkeit zu vermeiden, welche Zeile oder Spalte der Kontingenztafel zu den "exponierten" Fällen und welche zu den "Kontroll"-Fällen gehört. Im Gegensatz zum Chancenverhältnis beispielsweise ist das relative Risiko nicht invariant gegenüber einem Vertauschen der Zeilen oder Spalten.
- Parameter:
- exposed_casesnicht-negative ganze Zahl
Die Anzahl der "Fälle" (d. h. das Auftreten von Krankheiten oder anderen interessierenden Ereignissen) bei der Stichprobe der "exponierten" Personen.
- exposed_totalpositive ganze Zahl
Die Gesamtzahl der "exponierten" Personen in der Stichprobe.
- control_casesnicht-negative ganze Zahl
Die Anzahl der "Fälle" bei der Stichprobe der "Kontroll"- oder nicht exponierten Personen.
- control_totalpositive ganze Zahl
Die Gesamtzahl der "Kontroll"-Personen in der Stichprobe.
- Rückgabe:
- resultInstanz von
RelativeRiskResult Das Objekt hat das Float-Attribut
relative_risk, dasrr = (exposed_cases/exposed_total) / (control_cases/control_total)
Das Objekt hat auch die Methode
confidence_interval, um das Konfidenzintervall des relativen Risikos für ein gegebenes Konfidenzniveau zu berechnen.
- resultInstanz von
Siehe auch
Hinweise
Das R-Paket epitools hat die Funktion riskratio, die eine Tabelle mit folgendem Layout akzeptiert
disease=0 disease=1 exposed=0 (ref) n00 n01 exposed=1 n10 n11
Mit einer 2x2-Tabelle im obigen Format wird die Schätzung des KI von riskratio berechnet, wenn das Argument method="wald" angegeben ist, oder mit der Funktion riskratio.wald.
Beispielsweise bei einem Test auf das Auftreten von Lungenkrebs bei einer Stichprobe von Rauchern und Nichtrauchern würde die Kategorie "exponiert" "Raucher sein" entsprechen und die Kategorie "Krankheit" "Lungenkrebs haben oder gehabt haben" entsprechen.
Um dieselben Daten an
relative_riskzu übergeben, verwenden Sierelative_risk(n11, n10 + n11, n01, n00 + n01)
Hinzugefügt in Version 1.7.0.
Referenzen
[1]Alan Agresti, An Introduction to Categorical Data Analysis (zweite Auflage), Wiley, Hoboken, NJ, USA (2007).
Beispiele
>>> from scipy.stats.contingency import relative_risk
Dieses Beispiel stammt aus Beispiel 3.1 von [2]. Die Ergebnisse einer Herzstudie werden in der folgenden Tabelle zusammengefasst
High CAT Low CAT Total -------- ------- ----- CHD 27 44 71 No CHD 95 443 538 Total 122 487 609
CHD ist Koronare Herzkrankheit (Coronary Heart Disease), und CAT bezieht sich auf den Spiegel der zirkulierenden Katecholamine. CAT ist die "Expositions"-Variable, und hohes CAT ist die "exponierte" Kategorie. Die Daten aus der Tabelle, die an
relative_riskübergeben werden sollen, sind alsoexposed_cases = 27 exposed_total = 122 control_cases = 44 control_total = 487
>>> result = relative_risk(27, 122, 44, 487) >>> result.relative_risk 2.4495156482861398
Finden Sie das Konfidenzintervall für das relative Risiko.
>>> result.confidence_interval(confidence_level=0.95) ConfidenceInterval(low=1.5836990926700116, high=3.7886786315466354)
Das Intervall enthält nicht 1, daher unterstützen die Daten die Aussage, dass hohes CAT mit einem größeren Risiko für CHD verbunden ist.