tidymodels-remove-na2

tidymodels

statlearning

template

string

Published

November 15, 2023

Aufgabe

Das folgende Rezept ist gedacht, fehlende Werte aus dem Datensatz penguins zu entfernen. Allerdings erfüllt es diese Aufgabe nicht.

Finden Sie den Fehler und korrigieren Sie das Rezept.

Hinweise:

Verwenden Sie tidymodels.
Verwenden Sie Standardwerte, wo nicht anders angegeben.
Fixieren Sie Zufallszahlen auf den Startwert 42.

Lösung

# Setup:
library(tidymodels)
library(tidyverse)
library(easystats)


# Data:
d_path <- "https://vincentarelbundock.github.io/Rdatasets/csv/palmerpenguins/penguins.csv"
d <- read_csv(d_path)


# recipe:
rec1 <- recipe(body_mass_g ~  ., data = d) |> 
  step_naomit()

Als Check: Das gepreppte/bebackene Rezept:

rec1_prepped <- prep(rec1)
d_train_baked <- bake(rec1_prepped, new_data = NULL)

d_train_baked |> 
  head()

describe_distribution(d_train_baked)

Categories:

tidymodels
statlearning
template
string

---
exname: tidymodels-remove-na2
expoints: 1
extype: string
exsolution: NA
categories:
- tidymodels
- statlearning
- template
- string
date: '2023-11-15'
slug: tidymodels-remove-na2
title: tidymodels-remove-na2
execute:
  cache: true
  eval: false
---




# Aufgabe

<!-- Schreiben Sie eine Vorlage für eine prädiktive Analyse mit Tidymodels! -->

Das folgende Rezept ist gedacht, fehlende Werte aus dem  Datensatz `penguins` zu entfernen.
Allerdings erfüllt es diese Aufgabe nicht.

Finden Sie den Fehler und korrigieren Sie das Rezept.

Hinweise:

- Verwenden Sie `tidymodels`.
- Verwenden Sie Standardwerte, wo nicht anders angegeben.
- Fixieren Sie Zufallszahlen auf den Startwert 42.






</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>
</br>

# Lösung

```{r}
# Setup:
library(tidymodels)
library(tidyverse)
library(easystats)


# Data:
d_path <- "https://vincentarelbundock.github.io/Rdatasets/csv/palmerpenguins/penguins.csv"
d <- read_csv(d_path)


# recipe:
rec1 <- recipe(body_mass_g ~  ., data = d) |> 
  step_naomit() 

```

Als Check: Das gepreppte/bebackene Rezept:

```{r}
rec1_prepped <- prep(rec1)
d_train_baked <- bake(rec1_prepped, new_data = NULL)
```


```{r}
d_train_baked |> 
  head()
```

```{r}
describe_distribution(d_train_baked)
```





---

Categories: 

- tidymodels
- statlearning
- template
- string