# A tibble: 1 × 3
.metric .estimator .estimate
<chr> <chr> <dbl>
1 rmse standard 646.
Für R-Quadrat geht das analog:
d_test |>rsq(truth = count,estimate = pred)
Warning: A correlation computation is required, but `estimate` is constant and
has 0 standard deviation, resulting in a divide by 0 error. `NA` will be
returned.
# A tibble: 1 × 3
.metric .estimator .estimate
<chr> <chr> <dbl>
1 rsq standard NA
Leider ist das R-Quadrat in diesem Fall (per Definition) Null: Der Mittelwert als Vorhersagewert ist was “R-Quadrat gleich Null” meint.
(Darüber hinaus wird das R-Quadrat hier auf Basis der Korrelation berechnet, und wir haben einen konstanten Wert bei pred).
Categories:
regression
modelling
performance
rmse
string
Source Code
---exname: modellgute-testsetexpoints: 1extype: stringexsolution: NAcategories:- regression- performance- rmse- stringdate: '2023-11-08'slug: modellguete-testsettitle: modellguete-testset---# AufgabeBerechnen Sie die Modellgüte (RMSE) im Test-Sample.Gehen Sie von folgenden Annahmen aus.- [Dieses Test-Sample](https://raw.githubusercontent.com/sebastiansauer/yacsda-bikerental/main/data/bikeshare_control.csv)- AV: `count`- [Dieses Train-Sample](https://raw.githubusercontent.com/sebastiansauer/yacsda-bikerental/main/data/bikeshare_train.csv)- Gehen Sie als Vorhersage vom Mittelwert der AV im *Train-Sample* aus (für alle Beobachtungen im Test-Sample).*Hinweise*:- [Hier](https://github.com/sebastiansauer/yacsda-bikerental/blob/main/data/bike-share-data-dict.md) finden Sie ein Data-Dictionary.- Orientieren Sie sich im Übrigen an den [allgemeinen Hinweisen des Datenwerks](https://datenwerk.netlify.app/hinweise).</br></br></br></br></br></br></br></br></br></br># Lösung## Setup```{r}library(tidymodels)``````{r}d_train <-read.csv("https://raw.githubusercontent.com/sebastiansauer/yacsda-bikerental/main/data/bikeshare_train.csv")d_test <-read.csv("https://raw.githubusercontent.com/sebastiansauer/yacsda-bikerental/main/data/bikeshare_control.csv")```## Mittelwert der AV im Train-Sample berechnen```{r}mean_count_train_sample <- d_train |>summarise(count_avg =mean(count))mean_count_train_sample``````{r}d_test <- d_test |>mutate(pred =704)```Anstelle von `704` könnten Sie auch Ihre eigenen Vorhersagen Ihrer Modelle einsetzen, etwa:```{r eval = FALSE}d_test <- d_test |> mutate(pred = meine_vorhersagen)```## Modellgüte im Test-Sample berechnen```{r}d_test |>rmse(truth = count,estimate = pred)```Für R-Quadrat geht das analog:```{r}d_test |>rsq(truth = count,estimate = pred)```Leider ist das R-Quadrat in diesem Fall (per Definition) Null:Der Mittelwert als Vorhersagewert ist was "R-Quadrat gleich Null" meint.(Darüber hinaus wird das R-Quadrat hier auf Basis der Korrelation berechnet, und wir haben einen konstanten Wert bei `pred`).---Categories: - regression- modelling- performance- rmse- string