library(rstanarm)
library(easystats)
library(tidyverse)
wskt-mtcars-1l
post
bayes
regression
mtcars
Aufgabe
Prüfen Sie folgende Hypothese:
Ein Auto mit manueller Schaltung hat pro Gallone Sprit mind. 5 Meilen mehr Reichweite als ein Auto mit Automatikschaltung (ceteris paribus).
Quantifizieren Sie die Wahrscheinlichkeit dieser Hypothese!
Hinweise:
- Nutzen Sie die Bayes-Statistik mit
Stan
. - Beachten Sie die Standardhinweise des Datenwerks.
- Verwenden Sie den Datensatz
mtcars
.
Lösung
Setup
data(mtcars)
Modell
Die Hypothese kann man wie folgt formalisieren:
- Die Wahrscheinlichkeit, dass Manuellschalter eine höhere Reichweite haben, ist größer als die Wahrscheinlichkeit, dass Automatikschalter eine höhere Reichweite haben:
\[Pr(mpg_M > mpg_A) > Pr(mpg_M <= mpg_A)\]
- Oder anders gesagt: Die Wahrscheinlichkeit, dass Automatikschalter eine höhere Reichweite haben (pro Gallone Sprit und im Vergleich zu Automatikschalter) ist größer als 50%.
\[Pr(mpg_M > mpg_A) > 1/2\] 3. Möchte man noch hinzufügen, dass sich diese Behauptung auf ein bestimmtes, nämlich unser Regressionsmodell bezieht, kann man schreiben:
\[Pr(mpg_M > mpg_A \quad | \beta_0, \beta_1, \sigma)\]
Modell berechnen
<- stan_glm(mpg ~ am,
m data = mtcars,
refresh = 0,
seed = 42)
parameters(m)
Parameter | Median | 95% CI | pd | Rhat | ESS | Prior
------------------------------------------------------------------------------------------
(Intercept) | 17.14 | [14.85, 19.51] | 100% | 0.999 | 3739.00 | Normal (20.09 +- 15.07)
am | 7.21 | [ 3.72, 10.70] | 99.95% | 0.999 | 3755.00 | Normal (0.00 +- 30.20)
Post-Verteilung auslesen
<-
m_post |>
m as_tibble()
<-
prop |>
m_post count(am >= 5) |>
mutate(prop = n/sum(n))
prop
# A tibble: 2 × 3
`am >= 5` n prop
<lgl> <int> <dbl>
1 FALSE 431 0.108
2 TRUE 3569 0.892
Antwort
Laut unserem Modell beträgt die Wahrscheinlichkeit für obige Hypothese 0.89.