Aufgaben

  1. Aufgabe

    Welche der folgenden Zeilen zeigt den Likelihood?


    1. μ𝒩(0,10)\mu \sim \mathcal{N}(0, 10)
    2. σ𝒰(0,1)\sigma \sim \mathcal{U}(0, 1)
    3. yi=β0+β1xy_i = \beta_0 + \beta_1\cdot x
    4. yi𝒩(μ,σ)y_i \sim \mathcal{N}(\mu, \sigma)

  2. Aufgabe

    Wie viele Parameter hat das folgende Modell?

    Likelihood: hi𝒩(μ,σ)h_i \sim \mathcal{N}(\mu, \sigma)

    Prior für μ\mu: μ𝒩(178,20)\mu \sim \mathcal{N}(178, 20)

    Prior für σ\sigma: σ𝒰(0,50)\sigma \sim \mathcal{U}(0, 50)


    1. 0
    2. 1
    3. 2
    4. 3
    5. mehr

  3. Aufgabe

    Gegeben dem folgenden Modell, schreiben Sie die passende Form des Bayes-Theorem auf.

    Likelihood: hi𝒩(μ,σ)h_i \sim \mathcal{N}(\mu, \sigma)

    Prior für μ\mu: μ𝒩(178,20)\mu \sim \mathcal{N}(178, 20)

    Prior für σ\sigma: σ𝒰(0,50)\sigma \sim \mathcal{U}(0, 50)


  4. Aufgabe

    Gegeben dem folgenden Modell, simulieren Sie Daten aus der Prior-Verteilung (Priori-Prädiktiv-Verteilung).

    Likelihood: hi𝒩(μ,σ)h_i \sim \mathcal{N}(\mu, \sigma)

    Prior für μ\mu: μ𝒩(0,1)\mu \sim \mathcal{N}(0, 1)

    Prior für σ\sigma: σ𝒰(0,10)\sigma \sim \mathcal{U}(0, 10)


  5. Aufgabe

    Gegeben dem folgenden Modell, geben Sie den Befehl mit quap() an, um die Posteriori-Verteilung zu berechnen.

    Likelihood: hi𝒩(μ,σ)h_i \sim \mathcal{N}(\mu, \sigma)

    Prior für μ\mu: μ𝒩(0,1)\mu \sim \mathcal{N}(0, 1)

    Prior für σ\sigma: σ𝒰(0,10)\sigma \sim \mathcal{U}(0, 10)


  6. Aufgabe

    Betrachten Sie den Datensatz zur Größe der !Kung:

    library(tidyverse)
    url_kung <- "https://raw.githubusercontent.com/rmcelreath/rethinking/master/data/Howell1.csv"
    d <-
      read_delim(url_kung, delim = ";")  # Strichpunkt als Trennzeichen in der CSV-Datei
    1. Untersuchen Sie mit Hilfe eines Diagramms, ob bzw. inwieweit sich die Größe der erwachsenen Personen normalverteilt.

    2. Kennzahlen, die angegeben, inwieweit sich eine Größe normalverteilt, sind Schiefe und Kurtosis. Die Schiefe gibt an, wie symmetrische eine Verteilung ist.

    Normalverteilungen sind symmetrisch und haben daher einen Wert von 0 für Schiefe. Kurtosis gibt die “Wölbung”, also wie “spitz” oder “plattgedrückt” eine Verteilung ist. Eine Normalverteilung hat eine Wert von 3 für Kurtosis.

    Entsprechende R-Funktionen finden Sie z.B. im Paket moments. iBerechnen Sie die beiden Kennzahlen für die Gruppe der Erwachsenen sowie aufgeteilt nach dem Geschlecht. Interpretieren Sie das Ergebnis.

    1. Diskutieren Sie, inwieweit man aus biologisch fundierten Sachverhalten (also ontologisch) eine Normalverteilung der Körpergröße annehmen kann.

  7. Aufgabe

    Pupillendaten sind ein verbreiteter Analysegegenstand in Bereichen wie Psychologie, Marktforschung und Marketing.

    Betrachten wir dazu ein R-Paket (zum Vorverbarbeitung, preprocessing) und einen Datensatz der Uni Münster.

    library(PupilPre)
    data("Pupildat")
    d <-
      Pupildat %>% 
      select(size = RIGHT_PUPIL_SIZE,
             time = TIMESTAMP) %>% 
      mutate(size = size / 100) # in millimeter

    Mit dem R-Paket rstatix kann man sich bequem typische Statistiken ausgeben lassen. Aber natürlich können Sie auch mit summarise(mw = mean(size)) arbeiten.

    library(rstatix)
    d %>% 
      get_summary_stats()
    variable n min max median q1 q3 iqr mad mean sd se ci
    size 45343 1 25 8.2e+00 6.6e+00 11 3.9e+00 2.6e+00 1e+01 5.1e+00 0.02 0.05
    time 46950 1443974 4062110 3.6e+06 1.9e+06 3821381 1.9e+06 5.1e+05 3e+06 9.9e+05 4557.21 8932.20

    Wir verzichten hier auf eine Aufbereitung der Daten (was eigentlich nötig wäre, aber nicht Gegenstand dieser Übung ist). Stattdessen konzentrieren wir uns auf die Posteriori-Verteilung zur Pupillengröße.

    Wir sind also interessiert an einem Modell zur Schätzung der (Verteilung der) Pupillengröße; die Posteriori-Verteilung bildet das ab.

    1. Formulieren Sie ein passendes Modell.

    2. Verteidigen Sie Ihre Modellspezifikation.

    3. Simulieren Sie Daten aus der Priori-Verteilung. Kritisieren Sie die Wahl der Priori-Werte.

    4. Berechnen Sie die Posteriori-Verteilung mit den Pupillendaten d. Geben Sie zentrale Statistiken an.

    5. Geben Sie ein 90%-Intervall für die mittlere Pupillengröße an auf Basis der Posteriori-Verteilung.


  8. Aufgabe

    Intelligenz von Studentis

    Eine Psychologin möchte die Intelligenz von Studentis bestimmen: Was ist wohl der Mittelwert? Wie schlau sind die schlausten 10%? Von wo bis wo geht das mittlere 90%-Intervall von IQ-Werten? Natürlich ist ihr klar, dass es nicht reicht, einen Mittelwert zu schätzen. Nein, sie will alles, sprich: die Posteriori-Verteilung.

    Zuerst überlegt sie sich die Prioris: “Was ist meine Einschätzung zur Intelligenz von Studentis?”. Dazu liest sie alle verfügbare Literatur, beurteilt die methodische Qualität jeder einzelnen Studie und spricht mit den Expertis. Auf dieser Basis kommt sie zu folgenden Prioris:

    μ𝒩(115,5)\mu \sim \mathcal{N}(115, 5) Ein paar Überlegungen, die unsere Psychologin dazu hatte: Die Studentis sind im Mittel schlauer als die Normalbevölkerung. Um ein Gefühl für die Verteilungsfunktion vom IQ zu bekommen, nutzt sie folgenden R-Befehl:

    pnorm(q = 115, mean = 100, sd = 15)
    ## [1] 0.84

    Dieser Befehl gibt ihr an, welcher Prozentsatz der allgemeinen Bevölkerung (die Wahrscheinlichkeitsmasse) nicht schlauer ist als 115.

    Dann versucht sie ein Gefühl für die Streuung zu bekommen, folgender R-Befehl hilft ihr:

    q_iq <- 50
    rate_lambda <- 0.1
    pexp(q = q_iq, rate = rate_lambda)
    ## [1] 0.99

    Ah! Nimmt man an, dass Sigma exponentialverteilt ist mit einer Rate von 0.1, dass sind etwa 99 Prozent der Leute nicht mehr als q_iq IQ-Punkte vom Mittelwert μ\mu entfernt. Das deckt sich mit ihren Informationen aus der Literatur.

    Damit sind die Priors spezifiziert.

    1. Geben Sie die Priors an.
    2. Simulieren Sie die Prior-Prädiktiv-Verteilung dazu.
    3. Befragen Sie die Prior-Prädiktiv-Verteilung mit geeigneten Fragen Ihrer Wahl.

  9. Aufgabe

    In diesem Diagramm sehen Sie etwas Nomenklatur für eine Verteilung: Gipfel (Peak), Schultern (shoulders) und Ränder (tails). Bitte klicken Sie den Link, um sich das Diagramm anzuschauen.

    Taleb, N. N. (2019). The statistical consequences of fat tails, papers and commentaries. https://nassimtaleb.org/2020/01/final-version-fat-tails/

    Zwar sind viele Daten in der Welt normalverteilt, aber längst nicht alle. In jüngerer Zeit sind sog. “Fat Tails” in die Aufmerksamkeit gerückt. Das sind Variablen, bei denen Werte in den Rändern (tails) wahrscheinlicher sind als bei einer Normalverteilung; ein Beispiel für eine Fat-Tail-Verteilung ist die t-Verteilung mit 1 Freiheitsgrad. Sie müssen diese Verteilung nicht weiter kennen, teilung handelt.

    Recherchieren Sie (Fach-)Artikel, die argumentieren, dass ein bestimmtes Phänomen Fat-Tails zeigt!