library(tidyverse)
library(ggpubr)
saratoga-cor1
R
vis
causal
eda
Aufgabe
Importieren Sie den Datensatz saratoga
.
Gruppieren Sie den Datensatz in die Quartile für livingArea
.
Berechnen Sie dann den Zusammenhang zwischen price
und bedrooms
pro Quartil von livingArea
.
Hinweise:
- Beachten Sie die Standardhinweise des Datenwerks.
- Tipp: Die Funktion
ntile
aus{dplyr}
teilt eine Variablevar
in Quartile auf, wenn Sie schreibenntile(var, 4)
.
Lösung
Setup
data("SaratogaHouses", package = "mosaicData")
Gruppieren
<-
d2 |>
SaratogaHouses mutate(q = ntile(livingArea, 4)) |>
group_by(q)
Statistiken
|>
d2 summarise(korrelation = cor(bedrooms, price))
q | korrelation |
---|---|
1 | 0.1262003 |
2 | 0.0780997 |
3 | -0.1427274 |
4 | -0.0478333 |
Visualisierung
ggscatter(d2,
x = "bedrooms",
y = "price",
facet.by = "q",
add = "reg.line")