7  variability02

variability
basics
schoice
Veröffentlichungsdatum

2. Februar 2023

Schlüsselwörter

Aufgaben, Statistik, Prognose, Modellierung, R, Datenanalyse, Regression

7.1 Aufgabe

In welchem Datensatz (x1-x4) gibt es am meisten Variation?


groesse_df <-
  tibble(
    x1 = 170 + rnorm(n = 10, mean = 0, sd = 1),
    x2 = 190 + rnorm(n = 10, mean = 0, sd = 1),
    x3 = 170 + rnorm(n = 10, mean = 0, sd = 10),
    x4 = 170 + rnorm(n = 10, mean = 0, sd = 0.1),    
    id = 1:10
    )

Datensatz A:

groesse_df2 <-
  groesse_df %>% 
  mutate(groesse = x1) %>% 
  mutate(groesse_mw = mean(groesse)) %>% 
  mutate(abweichung = groesse - groesse_mw) %>% 
  mutate(vorzeichen = factor(sign(abweichung)))

groesse_df2 %>% 
  ggplot(aes(x = id)) +
  geom_segment(aes(xend = id, y = groesse, yend = groesse_mw, color = vorzeichen)) +
  geom_point(aes(x = id, y = groesse), color = "grey60", alpha = .7) +
  geom_hline(aes(yintercept = groesse_mw)) +
  labs(title = "Abweichung vom Mittelwert der Körpergröße")

Datensatz B:

groesse_df2 <-
  groesse_df %>% 
  mutate(groesse = x2) %>% 
  mutate(groesse_mw = mean(groesse)) %>% 
  mutate(abweichung = groesse - groesse_mw) %>% 
  mutate(vorzeichen = factor(sign(abweichung)))

groesse_df2 %>% 
  ggplot(aes(x = id)) +
  geom_segment(aes(xend = id, y = groesse, yend = groesse_mw, color = vorzeichen)) +
  geom_point(aes(x = id, y = groesse), color = "grey60", alpha = .7) +
  geom_hline(aes(yintercept = groesse_mw)) +
  labs(title = "Abweichung vom Mittelwert der Körpergröße")

Datensatz C:

groesse_df2 <-
  groesse_df %>% 
  mutate(groesse = x3) %>% 
  mutate(groesse_mw = mean(groesse)) %>% 
  mutate(abweichung = groesse - groesse_mw) %>% 
  mutate(vorzeichen = factor(sign(abweichung)))

groesse_df2 %>% 
  ggplot(aes(x = id)) +
  geom_segment(aes(xend = id, y = groesse, yend = groesse_mw, color = vorzeichen)) +
  geom_point(aes(x = id, y = groesse), color = "grey60", alpha = .7) +
  geom_hline(aes(yintercept = groesse_mw)) +
  labs(title = "Abweichung vom Mittelwert der Körpergröße")

Datensatz D:

groesse_df2 <-
  groesse_df %>% 
  mutate(groesse = x4) %>% 
  mutate(groesse_mw = mean(groesse)) %>% 
  mutate(abweichung = groesse - groesse_mw) %>% 
  mutate(vorzeichen = factor(sign(abweichung)))

groesse_df2 %>% 
  ggplot(aes(x = id)) +
  geom_segment(aes(xend = id, y = groesse, yend = groesse_mw, color = vorzeichen)) +
  geom_point(aes(x = id, y = groesse), color = "grey60", alpha = .7) +
  geom_hline(aes(yintercept = groesse_mw)) +
  labs(title = "Abweichung vom Mittelwert der Körpergröße")

7.2 Answerlist

  • A
  • B
  • C
  • D

7.3 Lösung

Hier ist die Streuung (SD) für die vier Datensätze (x1 bis x4):

groesse_df2 |> 
  summarise(across(x1:x4, sd))

7.4 Answerlist

  • Falsch
  • Falsch
  • Falsch
  • Wahr

Categories:

  • variablity
  • basics
  • schoice