library(tidyverse)
<- "https://raw.githubusercontent.com/rmcelreath/rethinking/master/data/Howell1.csv"
url_kung <-
d read_delim(url_kung, delim = ";") # Strichpunkt als Trennzeichen in der CSV-Datei
Kung-height
Exercise
Betrachten Sie den Datensatz zur Größe der !Kung:
Untersuchen Sie mit Hilfe eines Diagramms, ob bzw. inwieweit sich die Größe der erwachsenen Personen normalverteilt.
Kennzahlen, die angegeben, inwieweit sich eine Größe normalverteilt, sind Schiefe und Kurtosis. Die Schiefe gibt an, wie symmetrische eine Verteilung ist.
Normalverteilungen sind symmetrisch und haben daher einen Wert von 0 für Schiefe. Kurtosis gibt die “Wölbung”, also wie “spitz” oder “plattgedrückt” eine Verteilung ist. Eine Normalverteilung hat eine Wert von 3 für Kurtosis.
Entsprechende R-Funktionen finden Sie z.B. im Paket moments
. Berechnen Sie die beiden Kennzahlen für die Gruppe der Erwachsenen sowie aufgeteilt nach dem Geschlecht. Interpretieren Sie das Ergebnis.
- Diskutieren Sie, inwieweit man aus biologisch fundierten Sachverhalten (also ontologisch) eine Normalverteilung der Körpergröße annehmen kann.
Solution
- Visuelle Prüfung der Normalverteilung
<- d %>%
d2 filter(age >= 18)
<- d2 %>%
d3 select(-male)
ggplot(d2, aes(x = height)) +
geom_density()
ggplot(d2, aes(x = height )) +
facet_wrap(~ male) +
geom_density()
ggplot(d2, aes(x = height)) +
facet_wrap(~ male) +
geom_histogram(data = d3, fill = "grey60", alpha = .6) +
geom_histogram() +
labs(caption = "Grau hinterlegt ist das Histogramm für die Daten über beide Geschlechter")
- Schiefe und Kurtosis
library(easystats)
%>% skewness() d2
Parameter | Skewness | SE
----------------------------
height | 0.151 | 0.129
weight | 0.132 | 0.129
age | 0.665 | 0.129
male | 0.126 | 0.129
%>% kurtosis() d2
Parameter | Kurtosis | SE
----------------------------
height | -0.483 | 0.256
weight | -0.506 | 0.256
age | -0.213 | 0.256
male | -1.996 | 0.256
- Normalverteilung, Begründung
Es ist plausibel anzunehmen, dass der Phänotyp Körpergröße das Resultat des (kausalen) Einflusses vieler Gene ist, vieler Gene, die über einen vergleichbar starken Einfluss verfügen.
Eine besondere Situation stellt das X- bzw. Y-Chromosom dar, das Gene zum Geschlecht bereitstellt. Das Geschlecht ist ein einzelner Faktor, der (erfahrungsgemäß) einen relativ großen Einfluss auf die Körpergröße hat (in Anbetracht, dass vielleicht Tausende Gene additiv die Größe bestimmen). Insofern ist eine klarere Annäherung an die Normalverteilung zu erwarten, wenn man die Geschlechter einzeln betrachtet.
Categories:
- bayes
- ppv
- probability