library(tidyverse)
<- "https://raw.githubusercontent.com/rmcelreath/rethinking/master/data/Howell1.csv"
url_kung <-
d read_delim(url_kung, delim = ";") # Strichpunkt als Trennzeichen in der CSV-Datei
kung-height2
Exercise
Betrachten Sie den Datensatz zur Größe der !Kung:
Die Verteilung der Größe von Frauen und Männer in der Gruppe der Erwachsenen ist wie folgt:
#|echo: false
#|
<- d %>%
d2 filter(age >= 18)
# d3 <- d2 %>%
# select(-male)
ggplot(d2, aes(x = height)) +
geom_density()
ggplot(d2, aes(x = height )) +
facet_wrap(~ male) +
geom_density()
# ggplot(d2, aes(x = height)) +
# facet_wrap(~ male) +
# geom_histogram(data = d3, fill = "grey60", alpha = .6) +
# geom_histogram() +
# labs(caption = "Grau hinterlegt ist das Histogramm für die Daten über beide Geschlechter")
Aufgabe
- Ist die Größe der erwachsenen Personen normalverteilt?
- Welche Schiefe und welche Kurtosis weist die Normalverteilung auf?
- Diskutieren Sie, inwieweit man aus biologisch fundierten Sachverhalten (also ontologisch) eine Normalverteilung der Körpergröße annehmen kann.
Solution
- Normalverteilung
Ja, die Verteilungen sind beide einigermaßen normalverteilt.
- Schiefe und Kurtosis
Eine Normalverteilung hat eine Schiefe von 0 und eine Kurtosis von 3.
- Normalverteilung, Begründung
Es ist plausibel anzunehmen, dass der Phänotyp Körpergröße das Resultat des (kausalen) Einflusses vieler Gene ist, vieler Gene, die über einen vergleichbar starken Einfluss verfügen.
Eine besondere Situation stellt das X- bzw. Y-Chromosom dar, das Gene zum Geschlecht bereitstellt. Das Geschlecht ist ein einzelner Faktor, der (erfahrungsgemäß) einen relativ großen Einfluss auf die Körpergröße hat (in Anbetracht, dass vielleicht Tausende Gene additiv die Größe bestimmen). Insofern ist eine klarere Annäherung an die Normalverteilung zu erwarten, wenn man die Geschlechter einzeln betrachtet.