# Setup:
library(tidymodels)
library(tidyverse)
library(tictoc) # Zeitmessung
# Data:
d_path <- "https://vincentarelbundock.github.io/Rdatasets/csv/palmerpenguins/penguins.csv"
d <- read_csv(d_path)
# rm NA in the dependent variable:
d <- d %>%
drop_na(body_mass_g)
set.seed(42)
d_split <- initial_split(d)
d_train <- training(d_split)
d_test <- testing(d_split)rf-usemodels
tidymodels
statlearning
template
string
Aufgabe
Berechnen Sie ein prädiktives Modell mit dieser Modellgleichung:
body_mass_g ~ . (Datensatz: palmerpenguins::penguins).
Nutzen Sie usemodels!
Hinweise: - Tunen Sie mtry - Verwenden Sie Kreuzvalidierung - Verwenden Sie Standardwerte, wo nicht anders angegeben. - Fixieren Sie Zufallszahlen auf den Startwert 42.
Lösung
Vorbereitung:
library(usemodels)
use_ranger(body_mass_g ~ ., data = d_train)ranger_recipe <-
recipe(formula = body_mass_g ~ ., data = d_train)
ranger_spec <-
rand_forest(mtry = tune(), min_n = tune(), trees = 1000) %>%
set_mode("classification") %>%
set_engine("ranger")
ranger_workflow <-
workflow() %>%
add_recipe(ranger_recipe) %>%
add_model(ranger_spec)
set.seed(32162)
ranger_tune <-
tune_grid(ranger_workflow, resamples = stop("add your rsample object"), grid = stop("add number of candidate points"))
Oder die resultierende Syntax in die Zwischenablage kopieren lassen:
use_ranger(body_mass_g ~ ., data = d_train,
clipboard = TRUE) # kopiert Syntax in die ZwischenablageCategories:
- tidymodels
- statlearning
- template
- string