tidymodels-remove-na2

tidymodels
statlearning
template
string
Published

November 15, 2023

Aufgabe

Das folgende Rezept ist gedacht, fehlende Werte aus dem Datensatz penguins zu entfernen. Allerdings erfüllt es diese Aufgabe nicht.

Finden Sie den Fehler und korrigieren Sie das Rezept.

Hinweise:

  • Verwenden Sie tidymodels.
  • Verwenden Sie Standardwerte, wo nicht anders angegeben.
  • Fixieren Sie Zufallszahlen auf den Startwert 42.











Lösung

# Setup:
library(tidymodels)
library(tidyverse)
library(easystats)


# Data:
d_path <- "https://vincentarelbundock.github.io/Rdatasets/csv/palmerpenguins/penguins.csv"
d <- read_csv(d_path)


# recipe:
rec1 <- recipe(body_mass_g ~  ., data = d) |> 
  step_naomit() 

Als Check: Das gepreppte/bebackene Rezept:

rec1_prepped <- prep(rec1)
d_train_baked <- bake(rec1_prepped, new_data = NULL)
d_train_baked |> 
  head()
describe_distribution(d_train_baked)

Categories:

  • tidymodels
  • statlearning
  • template
  • string