#install.packages("palmerpenguins")
library(palmerpenguins)
data("penguins")
<- penguins d
penguins-vis-bodymass1
vis
Aufgabe
Im Datensatz palmerpenguins
: Welche der folgenden Variablen korreliert am stärksten mit dem Körpergewicht der Pinguine?
Beantworten Sie diese Frage mit Hilfe einer Visualisierung!
Sie können den Datensatz so beziehen:
Oder so:
<- read.csv("https://vincentarelbundock.github.io/Rdatasets/csv/palmerpenguins/penguins.csv") d
Ein Codebook finden Sie hier.
Hinweise:
- Orientieren Sie sich im Übrigen an den allgemeinen Hinweisen des Datenwerks.
Lösung
library(tidyverse)
library(DataExplorer)
<- read.csv("https://vincentarelbundock.github.io/Rdatasets/csv/palmerpenguins/penguins.csv") d
|>
d select(bill_depth_mm, bill_length_mm, flipper_length_mm, body_mass_g) |>
plot_scatterplot(by = "body_mass_g")
Es sieht so aus, also ob flipper_length_mm
am stärksten mit dem Körpergewicht zusammenhängt.
Alternative Art der Visualisierung:
library(ggpubr)
|> ggscatter(x = "bill_length_mm", "body_mass_g") d
|> ggscatter(x = "flipper_length_mm", "body_mass_g") d
|> ggscatter(x = "bill_depth_mm", "body_mass_g") d