library(tidymodels)
step-dummy
tidymodels
statlearning
schoice
Aufgabe
Viele Lernalgorithmen können nicht mit nominalen Variablen umgehen; daher muss man sie dummifizieren, um sie einer Verarbeitung zugänglich zu machen. In Tidymodels gibt es dafür step_dummy()
.
Aber bezieht step_dummy()
nur Variablen vom Typ factor
ein oder auch Variablen vom Typ character
? Oder vielleicht weder noch?
Hinweise:
- Orientieren Sie sich im Übrigen an den allgemeinen Hinweisen des Datenwerks.
Answerlist
- Nur Variablen vom Typ
factor
- Nur Variablen vom Typ
character
- Sowohl Variablen vom Typ
factor
als auch vom Typcharacter
- Weder Variablen vom Typ
factor
noch vom Typcharacter
Lösung
Setup
Daten:
<-
d data.frame(
y = c(1,2,3,4,5),
x = c("A", "B", "B", "C", "A")
)
str(d)
'data.frame': 5 obs. of 2 variables:
$ y: num 1 2 3 4 5
$ x: chr "A" "B" "B" "C" ...
Rezept 1
Rezept 1, mit Variable vom Typ character
:
<-
rec recipe(y ~ x, data = d) %>%
step_dummy(x)
<- rec %>%
d_baked prep() %>%
bake(new_data = NULL)
str(d_baked)
tibble [5 × 3] (S3: tbl_df/tbl/data.frame)
$ y : num [1:5] 1 2 3 4 5
$ x_B: num [1:5] 0 1 1 0 0
$ x_C: num [1:5] 0 0 0 1 0
Rezept 2
Rezept 2, mit Variable vom Typ factor
:
Daten:
<-
d2 data.frame(
y = c(1,2,3,4,5),
x = factor(c("A", "B", "B", "C", "A"))
)
str(d2)
'data.frame': 5 obs. of 2 variables:
$ y: num 1 2 3 4 5
$ x: Factor w/ 3 levels "A","B","C": 1 2 2 3 1
<-
rec2 recipe(y ~ x, data = d2) %>%
step_dummy(x)
<- rec2 %>%
d_baked2 prep() %>%
bake(new_data = NULL)
str(d_baked2)
tibble [5 × 3] (S3: tbl_df/tbl/data.frame)
$ y : num [1:5] 1 2 3 4 5
$ x_B: num [1:5] 0 1 1 0 0
$ x_C: num [1:5] 0 0 0 1 0
Answerlist
- Falsch
- Falsch
- Wahr.
step_dummy
transformiert beide Arten von Variablen - Falsch
Categories:
- tidymodels
- statlearning
- schoice