iq08

probability
simulation
normal-distribution
num
Published

November 8, 2023

Aufgabe

An einer Elite-Hochschule wird man nur zugelassen, wenn man sowohl schön als auch schlau ist.

“Schön” sei definiert als eine SD-Einheit über dem mittleren Aussehen, unter der Annahme, dass Aussehen normalverteilt ist.

“Schlau” sei definiert als eine SD-Einheit über dem mittleren Wert, unter der Annahme, dass die Variable normalverteilt ist.

Wie hoch ist die Wahrscheinlichkeit, an dieser Elite-Uni zugelassen zu werden?

Hinweise:

  • Nutzen Sie Simulationsmethoden.
  • Gehen Sie von folgender Verteilung für Schönheit und für Schlauheit aus: \(X \sim N(0,1)\)
  • Intelligenz und Schönheit sollen als unabhängig angenommen werden.
  • Geben Sie Anteile oder Wahrscheinlichkeiten stets mit zwei Dezimalstellen an (sofern nicht anders verlangt).
  • Simulieren Sie \(n=10^4\) Stichproben.
  • Nutzen Sie die Zahl 42 als Startwert für Ihre Zufallszahlen (um die Reproduzierbarkeit zu gewährleisten).
  • Weitere Hinweise











Lösung

Die Wahrscheinlichkeit für “schön”, \(S1\) ist gleich der Wahrscheinlichkeit für “Schlau”, \(S2\).

library(tidyverse)

Wir simulieren die Daten:

set.seed(42)

d <- tibble(
  id = 1:10^4,
  schoenheit = rnorm(n = 10^4, mean = 0, sd = 1),
  schlauheit = rnorm(n = 10^4, mean = 0, sd = 1))

Da es nur um Anteile (bzw. Wahrscheinlichkeiten) der Population geht, können wir mit z-Werten arbeiten.

Zur Erinnerung: Ein z-Wert von 1 bedeutet, dass der Messwert eine SD-Einheit größer ist als der Mittelwert der Verteilung.

Dann filtern wir wie in der Angabe gefragt:

d2 <-
  d %>% 
  count(schoenheit > 1, schlauheit > 1) %>%  # Das Komma wird als logisches UND interpretiert
  mutate(prop = n / sum(n))

d2
# A tibble: 4 × 4
  `schoenheit > 1` `schlauheit > 1`     n  prop
  <lgl>            <lgl>            <int> <dbl>
1 FALSE            FALSE             7082 0.708
2 FALSE            TRUE              1364 0.136
3 TRUE             FALSE             1314 0.131
4 TRUE             TRUE               240 0.024

Wieder nehmen wir den Anteil her und bezeichnen ihn als Wahrscheinlichkeit. Das ist eine schöne Sache dieser Simulationsmethoden: Es vereinfacht die Angelegenheit, denn mit Häufigkeiten lässt sich einfacher hantieren als mit Wahrscheinlichkeiten. Und die Anteile erfüllen die Kolmogorov-Axiome, wir können also beruhigt rechnen. Falls Sie also vor Sorge um die Reinheit der Mathematik nicht schlafen konnten, kann ich Sie insofern beruhigen :-)

Natürlich könnte man die Frage auch analytisch lösen (mit dem Multiplikationssatz für unabhängige Ereignisse).

Die Wahrscheinlichkeit für einen Wert \(x >= 115, X \sim N(100,15)\) beträgt:

pr_1sd_ueber_mw <- 1- pnorm(115, 100, 15)
pr_1sd_ueber_mw
[1] 0.1586553

Dannn:

pr_1sd_ueber_mw * pr_1sd_ueber_mw
[1] 0.02517149

Antwort: Die Lösung lautet also 0.024.

Interessant ist es vielleicht, die Gesamtpopulation zu visualisieren:

d %>% 
  mutate(ist_schoen = if_else(schoenheit > 1, TRUE, FALSE),
         ist_schlau = if_else(schlauheit > 1, TRUE, FALSE),
         ist_schoen_schlau = if_else(ist_schoen & ist_schlau, TRUE, FALSE)) %>% 
  ggplot() +
  aes(x = schoenheit, y = schlauheit, color = ist_schoen_schlau, alpha = .1) +
  geom_point()

Wäre die Aufnahmeregel, dass es reichte, entweder schön oder schlau (beides ist auch ok) zu sein, wäre der Anteil an zugelassenen Personen größer:

d3 <-
  d %>% 
  count(schoenheit > 1 | schlauheit > 1) %>%  # der horizontale Balken steht für das logische ODER.
  mutate(prop = n / sum(n))

d3
# A tibble: 2 × 3
  `schoenheit > 1 | schlauheit > 1`     n  prop
  <lgl>                             <int> <dbl>
1 FALSE                              7082 0.708
2 TRUE                               2918 0.292

Categories:

  • probability
  • simulation
  • normal-distribution
  • num