bootstrap

statlearning

inference

schoice

mtcars

Published

May 17, 2023

Aufgabe

In einer Analyse ist ein Team von Analysten interessiert, den Spritverbrauch von Fahrzeugen (gemessen in Meilen per Gallone mpg) in einem bestimmten Marksegment zu modellieren auf Basis der PS-Zahl (horse power, hp).

Das Team analysiert die vorliegenden Daten des Trainings-Datensatzes und stellt folgendes Modell auf:

data(mtcars)
lm1 <- lm(mpg ~ hp, data = mtcars)
coef(lm1)

(Intercept)          hp 
30.09886054 -0.06822828

Das Einflussgewicht des Prädiktors wird auf 0 geschätzt.

Im Testdatensatz wird nun der mittlere Verbrauch mittels Bootstrapping-Methode bestimmt. Es ergibt sich folgendes Diagramm:

Welche Aussage lässt sich aus diesem Diagramm ableiten?

Answerlist

Das 95%-Konfidenzintervall für den Einfluss von hp liegt ca. zwischen -0.10 und -0.05.
Das 95%-Konfidenzintervall für den Einfluss von hp liegt bei ca. -0.07.
Die resultierende Verteilung ist normalverteilt.
Eine Entscheidung zur statistischen Signifikanz des Prädiktors hp kann nicht abgeleitet werden.

Lösung

Categories:

statlearning
inference
schoice

---
extype: schoice
exsolution: 1000
exname: bootstrap
categories:
- statlearning
- inference
- schoice
- mtcars
date: '2023-05-17'
slug: bootstrap
title: bootstrap

---





# Aufgabe


In einer Analyse ist ein Team von Analysten interessiert, den Spritverbrauch von Fahrzeugen (gemessen in Meilen per Gallone `mpg`) in einem bestimmten Marksegment zu modellieren auf Basis der PS-Zahl (*horse power*, `hp`).

Das Team analysiert die vorliegenden Daten des Trainings-Datensatzes und stellt folgendes Modell auf:


```{r}
data(mtcars)
lm1 <- lm(mpg ~ hp, data = mtcars)
coef(lm1)
```

Das Einflussgewicht des Prädiktors wird auf `r round(coef(lm1))[2]` geschätzt.

Im Testdatensatz wird nun der mittlere Verbrauch mittels Bootstrapping-Methode bestimmt. Es ergibt sich folgendes Diagramm:


```{r boot1, echo = FALSE, fig.height = 3.5, fig.width = 5.8, fig.path = "", fig.cap = ""}
library(mosaic)
boot1 <- do(1000) * lm(mpg ~ hp, data = resample(mtcars))

gf_histogram(~hp, data = boot1)
```

Welche Aussage lässt sich aus diesem Diagramm ableiten?


Answerlist
----------
* Das 95%-Konfidenzintervall für den Einfluss von `hp` liegt ca. zwischen -0.10 und -0.05.
* Das 95%-Konfidenzintervall für den Einfluss von `hp` liegt bei ca. -0.07.
* Die resultierende Verteilung ist normalverteilt.
* Eine Entscheidung zur statistischen Signifikanz des Prädiktors `hp` kann nicht abgeleitet werden.





</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>

# Lösung





---

Categories: 

- statlearning
- inference
- schoice