7 variability02
variability
basics
schoice
Schlüsselwörter
Aufgaben, Statistik, Prognose, Modellierung, R, Datenanalyse, Regression
7.1 Aufgabe
In welchem Datensatz (x1-x4) gibt es am meisten Variation?
Datensatz A:
groesse_df2 <-
groesse_df %>%
mutate(groesse = x1) %>%
mutate(groesse_mw = mean(groesse)) %>%
mutate(abweichung = groesse - groesse_mw) %>%
mutate(vorzeichen = factor(sign(abweichung)))
groesse_df2 %>%
ggplot(aes(x = id)) +
geom_segment(aes(xend = id, y = groesse, yend = groesse_mw, color = vorzeichen)) +
geom_point(aes(x = id, y = groesse), color = "grey60", alpha = .7) +
geom_hline(aes(yintercept = groesse_mw)) +
labs(title = "Abweichung vom Mittelwert der Körpergröße")Datensatz B:
groesse_df2 <-
groesse_df %>%
mutate(groesse = x2) %>%
mutate(groesse_mw = mean(groesse)) %>%
mutate(abweichung = groesse - groesse_mw) %>%
mutate(vorzeichen = factor(sign(abweichung)))
groesse_df2 %>%
ggplot(aes(x = id)) +
geom_segment(aes(xend = id, y = groesse, yend = groesse_mw, color = vorzeichen)) +
geom_point(aes(x = id, y = groesse), color = "grey60", alpha = .7) +
geom_hline(aes(yintercept = groesse_mw)) +
labs(title = "Abweichung vom Mittelwert der Körpergröße")Datensatz C:
groesse_df2 <-
groesse_df %>%
mutate(groesse = x3) %>%
mutate(groesse_mw = mean(groesse)) %>%
mutate(abweichung = groesse - groesse_mw) %>%
mutate(vorzeichen = factor(sign(abweichung)))
groesse_df2 %>%
ggplot(aes(x = id)) +
geom_segment(aes(xend = id, y = groesse, yend = groesse_mw, color = vorzeichen)) +
geom_point(aes(x = id, y = groesse), color = "grey60", alpha = .7) +
geom_hline(aes(yintercept = groesse_mw)) +
labs(title = "Abweichung vom Mittelwert der Körpergröße")Datensatz D:
groesse_df2 <-
groesse_df %>%
mutate(groesse = x4) %>%
mutate(groesse_mw = mean(groesse)) %>%
mutate(abweichung = groesse - groesse_mw) %>%
mutate(vorzeichen = factor(sign(abweichung)))
groesse_df2 %>%
ggplot(aes(x = id)) +
geom_segment(aes(xend = id, y = groesse, yend = groesse_mw, color = vorzeichen)) +
geom_point(aes(x = id, y = groesse), color = "grey60", alpha = .7) +
geom_hline(aes(yintercept = groesse_mw)) +
labs(title = "Abweichung vom Mittelwert der Körpergröße")7.2 Answerlist
- A
- B
- C
- D
7.3 Lösung
Hier ist die Streuung (SD) für die vier Datensätze (x1 bis x4):
groesse_df2 |>
summarise(across(x1:x4, sd))7.4 Answerlist
- Falsch
- Falsch
- Falsch
- Wahr
Categories:
- variablity
- basics
- schoice



