library(tidyverse)
library(ggpubr)saratoga-cor1
R
vis
causal
eda
Aufgabe
Importieren Sie den Datensatz saratoga.
Gruppieren Sie den Datensatz in die Quartile für livingArea.
Berechnen Sie dann den Zusammenhang zwischen price und bedrooms pro Quartil von livingArea.
Hinweise:
- Beachten Sie die Standardhinweise des Datenwerks.
- Tipp: Die Funktion
ntileaus{dplyr}teilt eine Variablevarin Quartile auf, wenn Sie schreibenntile(var, 4).
Lösung
Setup
data("SaratogaHouses", package = "mosaicData")Gruppieren
d2 <-
SaratogaHouses |>
mutate(q = ntile(livingArea, 4)) |>
group_by(q)Statistiken
d2 |>
summarise(korrelation = cor(bedrooms, price))| q | korrelation |
|---|---|
| 1 | 0.1262003 |
| 2 | 0.0780997 |
| 3 | -0.1427274 |
| 4 | -0.0478333 |
Visualisierung
ggscatter(d2,
x = "bedrooms",
y = "price",
facet.by = "q",
add = "reg.line")