data(mtcars)
lm1 <- lm(mpg ~ hp, data = mtcars)
coef(lm1)(Intercept) hp
30.09886054 -0.06822828
May 17, 2023
In einer Analyse ist ein Team von Analysten interessiert, den Spritverbrauch von Fahrzeugen (gemessen in Meilen per Gallone mpg) in einem bestimmten Marksegment zu modellieren auf Basis der PS-Zahl (horse power, hp).
Das Team analysiert die vorliegenden Daten des Trainings-Datensatzes und stellt folgendes Modell auf:
Das Einflussgewicht des Prädiktors wird auf 0 geschätzt.
Im Testdatensatz wird nun der mittlere Verbrauch mittels Bootstrapping-Methode bestimmt. Es ergibt sich folgendes Diagramm:

Welche Aussage lässt sich aus diesem Diagramm ableiten?
hp liegt ca. zwischen -0.10 und -0.05.hp liegt bei ca. -0.07.hp kann nicht abgeleitet werden.
Categories:
---
extype: schoice
exsolution: 1000
exname: bootstrap
categories:
- statlearning
- inference
- schoice
- mtcars
date: '2023-05-17'
slug: bootstrap
title: bootstrap
---
# Aufgabe
In einer Analyse ist ein Team von Analysten interessiert, den Spritverbrauch von Fahrzeugen (gemessen in Meilen per Gallone `mpg`) in einem bestimmten Marksegment zu modellieren auf Basis der PS-Zahl (*horse power*, `hp`).
Das Team analysiert die vorliegenden Daten des Trainings-Datensatzes und stellt folgendes Modell auf:
```{r}
data(mtcars)
lm1 <- lm(mpg ~ hp, data = mtcars)
coef(lm1)
```
Das Einflussgewicht des Prädiktors wird auf `r round(coef(lm1))[2]` geschätzt.
Im Testdatensatz wird nun der mittlere Verbrauch mittels Bootstrapping-Methode bestimmt. Es ergibt sich folgendes Diagramm:
```{r boot1, echo = FALSE, fig.height = 3.5, fig.width = 5.8, fig.path = "", fig.cap = ""}
library(mosaic)
boot1 <- do(1000) * lm(mpg ~ hp, data = resample(mtcars))
gf_histogram(~hp, data = boot1)
```
Welche Aussage lässt sich aus diesem Diagramm ableiten?
Answerlist
----------
* Das 95%-Konfidenzintervall für den Einfluss von `hp` liegt ca. zwischen -0.10 und -0.05.
* Das 95%-Konfidenzintervall für den Einfluss von `hp` liegt bei ca. -0.07.
* Die resultierende Verteilung ist normalverteilt.
* Eine Entscheidung zur statistischen Signifikanz des Prädiktors `hp` kann nicht abgeleitet werden.
</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>
# Lösung
---
Categories:
- statlearning
- inference
- schoice