library(tidyverse)
library(ggpubr)
bayesbox2
1 Setup
2 Aufgabe
Sie führen ein zweiwertiges (binomiales) Zufallsexperiment \(n\)-mal durch, dabei erzielen Sie \(k\) Treffer. Die Wiederholungen sind unabhängig voneinander, und die Trefferwahrscheinlichkeit \(\pi\) bleibt konstant.
(Eine Münze wiederholt werfen wäre das typische Beispiel für ein solches Zufallexperiment.)
Gehen Sie von folgenden Parameterwerten aus:
<- 10
n <- 10 k
Welcher Parameterwert \(\pi\) ist am wahrscheinlichsten, wenn Sie keine weiteren Informationen haben?
Sie überprüfen alle 11 Parameterwerte für \(\pi\) von 0 bis 1 (in Schritten von 0.1.)
Um diese Frage zu beantworten, berechnen Sie die Wahrscheinlichkeiten für alle möglichen Parameterwerte \(\pi\) von 0 bis 1 in Schritten von 0.1 anhand einer Bayesbox. Dabei gehen wir von einer Binomialverteilung aus:
\(k \sim Bin(n, \pi)\).
[1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
Dann berechnen wir schon mal die Wahrscheinlichkeit der Daten gegeben jeweils eines Parameterwerts:
<- dbinom(k, size = n, prob = pis)
Likelihood Likelihood
[1] 0.0000000000 0.0000000001 0.0000001024 0.0000059049 0.0001048576
[6] 0.0009765625 0.0060466176 0.0282475249 0.1073741824 0.3486784401
[11] 1.0000000000
Auf dieser Basis erstellen wir eine Bayes-Box, um die Posteriori-Wahrscheinlichkeiten für alle Parameterwerte zu berechnen, s. Listing 2.
Die Bayes-Box (Table 1) zeigt, wie sich die Post-Verteilung berechnet.
Leider sind die zentralen Spalten ausgeblendet. 🤬
id | p | Priori |
---|---|---|
1 | 0.0 | 0.01 |
2 | 0.1 | 0.01 |
3 | 0.2 | 0.01 |
4 | 0.3 | 0.01 |
5 | 0.4 | 0.01 |
6 | 0.5 | 0.01 |
7 | 0.6 | 0.01 |
8 | 0.7 | 0.01 |
9 | 0.8 | 0.01 |
10 | 0.9 | 0.01 |
11 | 1.0 | 0.01 |
Aufgabe: Welcher Parameterwert \(\pi\) ist am wahrscheinlichsten laut der Bayesbox?
3 Lösung
Der wahrscheinlichste Parameterwert \(\pi\) ist derjenige, der die höchste Posteriori-Wahrscheinlichkeit hat.
Bei \(k=n\) Treffer hat \(p=1\) die höchste Posteriori-Wahrscheinlichkeit.
id | p | Priori | Likelihood | unstd_Post | Evidenz | Post |
---|---|---|---|---|---|---|
1 | 0.0 | 0.01 | 0.00 | 0.00 | 0.01 | 0.00 |
2 | 0.1 | 0.01 | 0.00 | 0.00 | 0.01 | 0.00 |
3 | 0.2 | 0.01 | 0.00 | 0.00 | 0.01 | 0.00 |
4 | 0.3 | 0.01 | 0.00 | 0.00 | 0.01 | 0.00 |
5 | 0.4 | 0.01 | 0.00 | 0.00 | 0.01 | 0.00 |
6 | 0.5 | 0.01 | 0.00 | 0.00 | 0.01 | 0.00 |
7 | 0.6 | 0.01 | 0.01 | 0.00 | 0.01 | 0.00 |
8 | 0.7 | 0.01 | 0.03 | 0.00 | 0.01 | 0.02 |
9 | 0.8 | 0.01 | 0.11 | 0.00 | 0.01 | 0.07 |
10 | 0.9 | 0.01 | 0.35 | 0.00 | 0.01 | 0.23 |
11 | 1.0 | 0.01 | 1.00 | 0.01 | 0.01 | 0.67 |
Hier ist eine Visualisierung der Posteriori-Wahrscheinlichkeiten:
ggline(d, x = "p", y = "Post",
xlab = "Trefferwahrscheinlichkeit", ylab = "Posteriori-Wahrscheinlichkeit",
title = "Posteriori-Wahrscheinlichkeiten für Trefferwahrscheinlichkeit",
add = c("point", "smooth"))