alphafehler-inflation4

probability
R
inference
string
Published

November 8, 2023

Aufgabe

Eine Klettererin verwendet ein Seil, dass eine Sicherheit von \(r=.99\) hat: mit einer Wahrscheinlichkeit von 1% reißt das Seil. Jetzt knüpft sie mehrere dieser Seile (hintereinander, Seil an Seil) zusammen zu einem “Gesamtseil”. Wie groß ist die Gefahr, dass das „Gesamtseil“ reist?

Hinweise:

  • Etwaige (physikalisch plausible) Verringerung der Zugfestigkeit durch (Seilbiegung aufgrund der) Knoten ist zu vernachlässigen.
  • Unterstellen Sie Unabhängkeit der einzelnen Ereignisse.
  • Wie immer, beachten sie die übrigen Hinweise des Datenwerks.

Betrachten wir mehrere Fälle:

  • Sie knüpft 2 zusammen.
  • Sie knüpft 5 zusammen.
  • Sie knüpft 10 zusammen.
  • Sie knüpft 20 zusammen.











Lösung

Sei \(R\) die Wahrscheinlichkeit, dass das Gesamtseil hält (nicht reißt). \(1-R\) ist dann die Wahrscheinlichkeit des Gegenereignisses: das Gesamtseil reißt.

Allgemein ist \(R\) bei k Tests gleich r hoch k: \(R=r^k\). (Das Aufaddieren der Fehlalarm-Wahrscheinlichkeit bezeichnet man als Alphafehler-Inflation.)

library(tidyverse)
r <- .99
R2 <- r^2 %>% round(2)  # Auf 2 Dezimalen runden
R5  <- r^5  %>% round(2)
R10 <- r^10  %>% round(2)
R20 <- r^20  %>% round(2)

Die Gesamtsicherheiten lauten also:

R2
[1] 0.98
R5
[1] 0.95
R10
[1] 0.9
R20
[1] 0.82

Die Seilriss-Gefahr ist dann:

1 - R2
[1] 0.02
1 - R5
[1] 0.05
1 - R10
[1] 0.1
1 - R20
[1] 0.18

Vertiefung

Betrachten wir abschließend aus Neugier die Wahrscheinlichkeit, dass die Klettererin abstürzt (\(1-R\)) als Funktion der Anzahl der Seie.

Diese Überlegung ist etwas weiterführender und nicht ganz so zentral, aber ziemlich interessant.

Definieren wir die Parameter:

anz_seile <- 1:20  # von 1 bis max 20 Seile
r <- c(.9, .95, .99, .999)  # verschiedene Seil-Sicherheiten

Jetzt erstellen wir einen Tabelle, die alle anz_seile * r Werte kombiniert:

d <- 
  expand_grid(anz_seile, r)

head(d)
# A tibble: 6 × 2
  anz_seile     r
      <int> <dbl>
1         1 0.9  
2         1 0.95 
3         1 0.99 
4         1 0.999
5         2 0.9  
6         2 0.95 

Jetzt berechnen wir für jede Kombination die Gesamtsicherheit R sowie die Wahrscheinlichkeit, dass das Seil reißt, \(1-R\):

d <-
  d %>% 
  mutate(R = r^anz_seile,
         seil_reisst_prob = 1 - R)

Und plotten das Ganze mit dem Paket ggpubr:

library(ggpubr)
d <-
  d |> 
  mutate(r_fctr = factor(r))  # um "r" zum Gruppieren zu verwenden, sollte es eine nominale Variable sein, daher wandeln wir mit "factor" in eine nominale Variable um.

ggline(d,
       x = "anz_seile",
       y = "seil_reisst_prob",
       color = "r_fctr",
       linetype = "r_fctr",
       group = "r_fctr") +
  labs(color = "Reißfestigkeit",
       linetype = "Reißfestigkeit")

Oder mit ggplot plotten:

d %>% 
  ggplot(aes(x = anz_seile,
             y = seil_reisst_prob,
             color = factor(r))) +
  geom_line() +
  labs(color = "Reißfestigkeit")

Hat ein Seil eine Sicherheit von 90%, dann will man nicht dranhängen, wenn 20 Seile zusammengeknotet sind!

Antworten:

  • \(R_2 = r\cdot r = r^2 = 0.98\)
  • \(R_5 = r^5 = 0.95\)
  • \(R_{10}= r^{10} = 0.9\)
  • \(R_{20}= r^{20} = 0.82\)

Categories:

  • probability
  • R
  • inference
  • string