84  korr02

dyn
eda
association
num
Veröffentlichungsdatum

8. Mai 2023

Schlüsselwörter

Aufgaben, Statistik, Prognose, Modellierung, R, Datenanalyse, Regression

84.1 Aufgabe

# source: https://medium.com/geekculture/how-to-generate-correlated-data-in-r-57a675b7fd2f

cor_preset <- sample(c(.9, .4, 0, -.4, -.9), 1)

# create the variance covariance matrix
sigma<-rbind(c(1,cor_preset), c(cor_preset, 1))
# create the mean vector
mu<-c(0, 1)
# generate the multivariate normal distribution
df<-as.data.frame(mvrnorm(n=1000, mu=mu, Sigma=sigma))

Welcher Korrelationswert (Pearson) beschreibt die Korrelation in den Daten am besten?

  • .9
  • .4
  • 0
  • -0.4
  • -0.9
df |> 
  ggplot(aes(V1,V2)) +
  geom_point()

84.2 Lösung

Die Korrelation in der zugehörigen (bivariaten) Population beträgt 0.4.

In der Stichprobe kann der zugehörige Wert (etwas abweichen).

Das ist genauso, wie wenn man sagt, dass der “mittlere deutsche Mann” 1,80m groß sei, aber wenn Sie eine Stichprobe ziehen, muss der Mittelwert ja auch nicht (notwendigerweise) exakt bei 1,80m liegen.

ggpairs(df)


Categories:

  • dyn
  • eda
  • association
  • num