Kung-height

bayes
ppv
probability
Published

November 5, 2022

Exercise

Betrachten Sie den Datensatz zur Größe der !Kung:

library(tidyverse)
url_kung <- "https://raw.githubusercontent.com/rmcelreath/rethinking/master/data/Howell1.csv"
d <-
  read_delim(url_kung, delim = ";")  # Strichpunkt als Trennzeichen in der CSV-Datei
  1. Untersuchen Sie mit Hilfe eines Diagramms, ob bzw. inwieweit sich die Größe der erwachsenen Personen normalverteilt.

  2. Kennzahlen, die angegeben, inwieweit sich eine Größe normalverteilt, sind Schiefe und Kurtosis. Die Schiefe gibt an, wie symmetrische eine Verteilung ist.

Normalverteilungen sind symmetrisch und haben daher einen Wert von 0 für Schiefe. Kurtosis gibt die “Wölbung”, also wie “spitz” oder “plattgedrückt” eine Verteilung ist. Eine Normalverteilung hat eine Wert von 3 für Kurtosis.

Entsprechende R-Funktionen finden Sie z.B. im Paket moments. Berechnen Sie die beiden Kennzahlen für die Gruppe der Erwachsenen sowie aufgeteilt nach dem Geschlecht. Interpretieren Sie das Ergebnis.

  1. Diskutieren Sie, inwieweit man aus biologisch fundierten Sachverhalten (also ontologisch) eine Normalverteilung der Körpergröße annehmen kann.











Solution

  1. Visuelle Prüfung der Normalverteilung
d2 <- d %>% 
  filter(age >= 18)

d3 <- d2 %>% 
  select(-male)

ggplot(d2, aes(x = height)) +
  geom_density()

ggplot(d2, aes(x = height )) +
  facet_wrap(~ male) +
    geom_density()

ggplot(d2, aes(x = height)) +
  facet_wrap(~ male) +
  geom_histogram(data = d3, fill = "grey60", alpha = .6) +
    geom_histogram() +
  labs(caption = "Grau hinterlegt ist das Histogramm für die Daten über beide Geschlechter")

  1. Schiefe und Kurtosis
library(easystats)
d2 %>%  skewness()
Parameter | Skewness |    SE
----------------------------
height    |    0.151 | 0.129
weight    |    0.132 | 0.129
age       |    0.665 | 0.129
male      |    0.126 | 0.129
d2 %>% kurtosis()
Parameter | Kurtosis |    SE
----------------------------
height    |   -0.483 | 0.256
weight    |   -0.506 | 0.256
age       |   -0.213 | 0.256
male      |   -1.996 | 0.256
  1. Normalverteilung, Begründung

Es ist plausibel anzunehmen, dass der Phänotyp Körpergröße das Resultat des (kausalen) Einflusses vieler Gene ist, vieler Gene, die über einen vergleichbar starken Einfluss verfügen.

Eine besondere Situation stellt das X- bzw. Y-Chromosom dar, das Gene zum Geschlecht bereitstellt. Das Geschlecht ist ein einzelner Faktor, der (erfahrungsgemäß) einen relativ großen Einfluss auf die Körpergröße hat (in Anbetracht, dass vielleicht Tausende Gene additiv die Größe bestimmen). Insofern ist eine klarere Annäherung an die Normalverteilung zu erwarten, wenn man die Geschlechter einzeln betrachtet.


Categories:

  • bayes
  • ppv
  • probability