Krebs1

bayes
probability
num
bayesbox
Published

November 8, 2023

Aufgabe

Ein Krebstest (\(T\)) habe die Wahrscheinlichkeit von 0.9, einen vorhandenen Krebs (\(K\)) zu erkennen. Diese Wahrscheinlichkeit bezeichnen wir als \(Pr(T+|K+)\). Der Test erkennt also die meisten Krebsfälle, und ein paar werden übersehen.

Manchmal macht der Test auch den umgekehrten Fehler: Ein gesunder Mensch wird fälschlich Krebs diagnostiziert, \(Pr(T+|K-)\). Diese Wahrscheinlichkeit liegt bei dem Test bei 0.1, zum Glück also relativ gering.

Die Grundrate dieser Krebsart belaufe sich in der Population auf 0.01, \(Pr(K+)\).

Aufgabe: Berechnen Sie die Wahrscheinlichkeit, dass ein Patient tatsächlich Krebs hat, wenn der Test positiv ist, also Krebs diagnostiziert hat!











Lösung

Hier kann man Bayes Theorem anwenden:

\(Pr(K|T) = \frac{Pr(K) \cdot Pr(T|K) }{Pr(T)}\).

zaehler_bayes <- Pr_Kpos * Pr_Tpos_geg_Kpos
zaehler_bayes
[1] 0.009
Pr_T <- (zaehler_bayes + (1-Pr_Kpos) * Pr_Tpos_geg_Kneg)
Pr_T
[1] 0.108
sol <- Pr_Kpos_geg_Tpos <- zaehler_bayes / Pr_T 
sol <- round(sol, 2)
sol
[1] 0.08

Die Lösung beträgt also: 0.08.

Hier ist ein Baumdiagramm zur Visualisierung:

flowchart LR
  S[1000 Personen] --> K[Krebs: 10]
  S --> NK[Nicht-Krebs: 990]
  K --> T[Test positiv: 9]
  K --> NT[Nicht Test positiv: 1]
  NK --> TNK[Test positiv: 99]
  NK --> NTNK[Nicht Test positiv: 891]

Man kann die Aufgabe auch mit dem Baumdiagramm lösen:

Es erhalten 108=99+9 Personen ein positives Testergebnis. Davon haben 9 tatsächlich Krebs. Also: \(Pr(K+|T+) = \frac{9}{108} = 0.0833\).

Alternativ kann man auch mit der Bayesbox arbeiten:

Hypothese Prior Likelihood Post_unstand Evidenz Post
K .01 .9 .009 .108 .083
NK .99 .1 .099 .108 .092

K: Krebs NK: Nicht-Krebs

Die Likelihood für die Hypothese \(K\) (die Hypothese, dass Krebs vorliegt) ist definiert als \(Pr(D|H)=.9\). Hier entspricht der positive Krebstest den Daten. Die Likelihood für die Hypothese \(NK\) (die Hypothese, dass kein Krebs vorliegt) ist definiert als \(Pr(D|\neg H)=.9\). Hier entspricht der negative Krebstest den Daten.

Die unstandardisierte Post-Wahrscheinlichkeit entspricht dem Produkt aus Likelihood und Prior: \(Pr(D|H) \cdot Pr(H)=.009\) bzw. \(.099\).

Die Evidenz ist die Summe der Posterior-Wahrscheinlichkeiten multipliziert mit den jeweiligen Priors: \(Pr(D)=.108\).

Die Post-Wahrscheinlichkeit ist die durch die Evidenz dividierte unstandardisierte Post-Wahrscheinlichkeit: \(Pr(H|D)=.083\) bzw. \(.092\).


Categories:

  • bayes
  • probability
  • num