data(mtcars)
<- lm(mpg ~ hp, data = mtcars)
lm1 coef(lm1)
(Intercept) hp
30.09886054 -0.06822828
May 17, 2023
In einer Analyse ist ein Team von Analysten interessiert, den Spritverbrauch von Fahrzeugen (gemessen in Meilen per Gallone mpg
) in einem bestimmten Marksegment zu modellieren auf Basis der PS-Zahl (horse power, hp
).
Das Team analysiert die vorliegenden Daten des Trainings-Datensatzes und stellt folgendes Modell auf:
Das Einflussgewicht des Prädiktors wird auf 0 geschätzt.
Im Testdatensatz wird nun der mittlere Verbrauch mittels Bootstrapping-Methode bestimmt. Es ergibt sich folgendes Diagramm:
Welche Aussage lässt sich aus diesem Diagramm ableiten?
hp
liegt ca. zwischen -0.10 und -0.05.hp
liegt bei ca. -0.07.hp
kann nicht abgeleitet werden.
Categories:
---
extype: schoice
exsolution: 1000
exname: bootstrap
categories:
- statlearning
- inference
- schoice
- mtcars
date: '2023-05-17'
slug: bootstrap
title: bootstrap
---
# Aufgabe
In einer Analyse ist ein Team von Analysten interessiert, den Spritverbrauch von Fahrzeugen (gemessen in Meilen per Gallone `mpg`) in einem bestimmten Marksegment zu modellieren auf Basis der PS-Zahl (*horse power*, `hp`).
Das Team analysiert die vorliegenden Daten des Trainings-Datensatzes und stellt folgendes Modell auf:
```{r}
data(mtcars)
lm1 <- lm(mpg ~ hp, data = mtcars)
coef(lm1)
```
Das Einflussgewicht des Prädiktors wird auf `r round(coef(lm1))[2]` geschätzt.
Im Testdatensatz wird nun der mittlere Verbrauch mittels Bootstrapping-Methode bestimmt. Es ergibt sich folgendes Diagramm:
```{r boot1, echo = FALSE, fig.height = 3.5, fig.width = 5.8, fig.path = "", fig.cap = ""}
library(mosaic)
boot1 <- do(1000) * lm(mpg ~ hp, data = resample(mtcars))
gf_histogram(~hp, data = boot1)
```
Welche Aussage lässt sich aus diesem Diagramm ableiten?
Answerlist
----------
* Das 95%-Konfidenzintervall für den Einfluss von `hp` liegt ca. zwischen -0.10 und -0.05.
* Das 95%-Konfidenzintervall für den Einfluss von `hp` liegt bei ca. -0.07.
* Die resultierende Verteilung ist normalverteilt.
* Eine Entscheidung zur statistischen Signifikanz des Prädiktors `hp` kann nicht abgeleitet werden.
</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>
# Lösung
---
Categories:
- statlearning
- inference
- schoice