kung-height2

bayes
paper
probability
Published

November 11, 2023

Exercise

Betrachten Sie den Datensatz zur Größe der !Kung:

library(tidyverse)
url_kung <- "https://raw.githubusercontent.com/rmcelreath/rethinking/master/data/Howell1.csv"
d <-
  read_delim(url_kung, delim = ";")  # Strichpunkt als Trennzeichen in der CSV-Datei

Die Verteilung der Größe von Frauen und Männer in der Gruppe der Erwachsenen ist wie folgt:

#|echo: false
#|
d2 <- d %>% 
  filter(age >= 18)

# d3 <- d2 %>% 
#   select(-male)

ggplot(d2, aes(x = height)) +
  geom_density()

ggplot(d2, aes(x = height )) +
  facet_wrap(~ male) +
    geom_density()

# ggplot(d2, aes(x = height)) +
#   facet_wrap(~ male) +
#   geom_histogram(data = d3, fill = "grey60", alpha = .6) +
#     geom_histogram() +
#   labs(caption = "Grau hinterlegt ist das Histogramm für die Daten über beide Geschlechter")

Aufgabe

  1. Ist die Größe der erwachsenen Personen normalverteilt?
  2. Welche Schiefe und welche Kurtosis weist die Normalverteilung auf?
  3. Diskutieren Sie, inwieweit man aus biologisch fundierten Sachverhalten (also ontologisch) eine Normalverteilung der Körpergröße annehmen kann.











Solution

  1. Normalverteilung

Ja, die Verteilungen sind beide einigermaßen normalverteilt.

  1. Schiefe und Kurtosis

Eine Normalverteilung hat eine Schiefe von 0 und eine Kurtosis von 3.

  1. Normalverteilung, Begründung

Es ist plausibel anzunehmen, dass der Phänotyp Körpergröße das Resultat des (kausalen) Einflusses vieler Gene ist, vieler Gene, die über einen vergleichbar starken Einfluss verfügen.

Eine besondere Situation stellt das X- bzw. Y-Chromosom dar, das Gene zum Geschlecht bereitstellt. Das Geschlecht ist ein einzelner Faktor, der (erfahrungsgemäß) einen relativ großen Einfluss auf die Körpergröße hat (in Anbetracht, dass vielleicht Tausende Gene additiv die Größe bestimmen). Insofern ist eine klarere Annäherung an die Normalverteilung zu erwarten, wenn man die Geschlechter einzeln betrachtet.