Aufgaben

  1. Aufgabe

    Erstellen Sie die Posteriori-Verteilung für den Globusversuch. Nutzen Sie dafür diese Syntax:

    p_grid <- seq( from=0 , to=1 , length.out=1000 )  # Gitterwerte
    
    prior <- rep( 1 , 1000 )  # Priori-Gewichte
    
    likelihood <- dbinom( 6 , size=9 , prob=p_grid ) 
    
    unstandardisierte_posterior <- likelihood * prior 
    
    posterior <- unstandardisierte_posterior / sum(unstandardisierte_posterior)
    
    # um die Zufallszahlen festzulegen, damit alle die gleichen Zufallswerte bekommen: 
    set.seed(100) 
    
    # Stichproben ziehen aus der Posteriori-Verteilung
    samples <- 
      tibble(
        p = sample( p_grid , prob=posterior, size=1e4, replace=TRUE)) %>% 
      mutate(
        id = row_number())
    1. Wie viel Wahrscheinlichkeitsmasse liegt unter p=0.2p=0.2?

    2. Wie viel Wahrscheinlichkeitsmasse liegt über p=0.8p=0.8?

    3. Welcher Anteil der Posteriori-Verteilung liegt zwischen p=0.2p=0.2 und p=0.8p=0.8?

    4. Unter welchem Wasseranteil pp liegen 10% der Posteriori-Verteilung?

    5. Über welchem Wasseranteil pp liegen 10% der Posteriori-Verteilung?

    6. Welches schmälstes Intervall von pp enhält 66% der Posteriori-Wahrscheinlichkeit?

    7. Welcher Wertebereich (synonym: Welches Intervall) von pp enthält 66% der Posteriori-Wahrscheinlichkeit (hier wird Posteriori-Wahrscheinlichkeit syonyom gebraucht zu Posteriori-Verteilung)? Wie nennt man diese Arten von Intervall?


  2. Aufgabe

    Nehmen wir an, wir haben 8 (Wasser-)“Treffer” (W=8W=8) bei 15 Würfen (N=15N=15) erhalten (wieder im Globusversuch). Gehen Sie wieder von einer “flachen”, also gleichverteilten, Priori-Verteilung aus.

    Berechnen Sie die Posterori-Verteilung und visualisieren Sie sie. Nutzen Sie die Gittermethode.


  3. Aufgabe

    Nehmen wir an, wir haben 8 (Wasser-)“Treffer” (W=8W=8) bei 15 Würfen (N=15N=15) erhalten (wieder im Globusversuch).

    1. Führen Sie einen Posteriori-Prädiktiv-Check durch: Erstellen Sie also eine Posteriori-Prädiktiv-Verteilung (PPV). Mit anderen Worten: Erstellen Sie die Stichprobenverteilung, gemittelt über die Posteriori-Wahrscheinlichkeiten des Wasseranteils pp!

    2. Visualisieren Sie die PPV!

    3. Was ist die Wahrscheinlichkeit laut PPV 8 von 15 Treffer zu erzielen (also 8 Wasser in 15 Würfen)?


  4. Aufgabe

    Nehmen wir an, wir haben 8 (Wasser-)“Treffer” (W=8W=8) bei 15 Würfen (N=15N=15) erhalten (wieder im Globusversuch).

    Berechnen Sie auf Basis der aktuellen Posteriori-Verteilung die Wahrscheinlichkeit für 6 Wasser bei 9 Würfen (W=6,N=9W=6, N=9).


  5. Aufgabe

    Nehmen wir an, wir haben 8 (Wasser-)“Treffer” (W=8W=8) bei 15 Würfen (N=15N=15) erhalten (wieder im Globusversuch).

    Nehmen Sie dieses Mal keine gleichverteilte Priori-Verteilung an. Stattdessen verwenden Sie einen Priori-Wert von Null solange p<0.5p < 0.5 und einen konstanten Wert für p0.5p \ge 0.5. Diese Priori-Verteilung kodiert die Information, dass mindestens die Hälfte der Erdoberfläche mit Sicherheit aus Wasser besteht.

    Für alle folgenden Berechnungen, vergleichen Sie Ihre Ergebnisse zu der analogen Analyse mit einem konstanten (gleichverteilten) Priori-Wert!

    1. Berechnen Sie die Posteriori-Verteilung und visualisieren Sie sie. Nutzen Sie die Gittermethode.

    2. Ziehen Sie 10410^4 Stichproben aus der Posteriori-Verteilung, die Sie mit der Gittermethode erhalten haben. Berechnen Sie auf dieser Grundlage das 90%-HDPI.

    3. Berechnen Sie die PPV für dieses Modell. Was ist die Wahrscheinlichkeit 8 von 15 Treffer zu erzielen laut dieser PPV?

    4. Auf Basis der aktuellen Posteriori-Wahrscheinlichkeit: Was ist die Wahrscheinlichkeit für 6 Wasser bei 9 Würfen?


  6. Aufgabe

    Nach einem langen Unitag machen Sie sich auf den Weg nach Hause; ihr Weg führt Sie durch eine dunkle Ecke. Just dort regt sich auf einmal eine Gestalt in den Schatten. Die Person spricht Sie an: „Na, Lust auf ein Spielchen?“. Sie willigen sofort ein. Die Person stellt sich als ein Statistiker vor, dessen Namen nichts zur Sache tue; das Gesicht kommt Ihnen vage bekannt vor. „Pass auf“, erklärt der Statistiker, „wir werfen eine Münze, ich setze auf Zahl“. Dass er auf Zahl setzt, überrascht Sie nicht. „Wenn ich gewinne“, fährt der Statistiker fort, „bekomme ich 10 Euro von Dir, wenn Du gewinnst, bekommst Du 11 Euro von mir. Gutes Spiel, oder?“. Sie einigen sich auf 10 Durchgänge, in denen der Statistiker jedes Mal eine Münze wirft, fängt und dann die oben liegende Seite prüft. Erster Wurf: Zahl! Der Statistiker gewinnt. Pech für Sie. Zweiter Wurf: Zahl! Schon wieder 10 Euro für den Statistiker. Hm. Dritter Wurf: . . . Zahl! Schon wieder. Aber kann ja passieren, bei einer fairen Münze, oder? Vierter Wurf: Zahl! Langsam regen sich Zweifel bei Ihnen. Kann das noch mit rechten Dingen zugehen? Ist die Münze fair? Insgesamt gewinnt der zwielichte Statistiker 8 von 10 Durchgängen.

    Unter leisem Gelächter des Statistikers (und mit leeren Taschen) machen Sie sich von dannen. Hat er falsch gespielt? Wie plausibel ist es, bei 10 Würfen 8 Treffer zu erhalten, wenn die Münze fair ist? Ist das ein häufiges, ein typisches Ereignis oder ein seltenes, untypisches Ereignis bei einer fairen Münze? Wenn es ein einigermaßen häufiges Ereignis sein sollte, dann spricht das für die Fairness der Münze. Zumindest spricht ein Ereignis, welches von einer Hypothese als häufig vorausgesagt wird und schließlich eintritt, nicht gegen eine Hypothese. Zuhause angekommen, denken Sie sich, jetzt müssen Sie erstmal in Ruhe die Posteriori-Verteilung und die PPV ausrechnen!

    1. Berechnen Sie die Posteriori-Verteilung mit der Gittermethode! Gehen Sie von einer gleichverteilten Priori-Wahrscheinlichkeit aus. Visualisieren Sie sie. Alle folgenden Teil-Fragen bauen auf der Post-Verteilung auf.

    2. Wie groß ist die Wahrscheinlichkeit, auf Basis der Post-Verteilung, dass die Münze zugunsten des Dozenten gezinkt ist?

    3. Geben Sie das 50%-PI und 50%-HDPI zum Parameterwert (pp der Münze) an!

    4. Mit welcher Wahrscheinlichkeit liegt die Trefferchance der Münze zwischen p=.45p=.45 und p=.55p=.55, ist also nicht “nennenswert” gezinkt?

    5. Was ist der wahrscheinlichste Parameterwert (Trefferchance der Münze)?

    6. Geben Sie das 90%-PI und 90%-HDPI zu Parameterwert (pp der Münze) an!

    7. Berechnen Sie die PPV! Visualisieren Sie sie. Interpretieren Sie die PPV.

    8. Diskutieren Sie die Annahme einer Gleichverteilung des Priori-Wertes von pp!


  7. Aufgabe

    Sie sind kürzlich in ein Startup-Unternehmen eingestiegen. Das Unternehmen versucht, einen Online-Weinhandel aufzubauen. Kern des Unternehmens ist eine künstliche Intelligenz, die versucht, den Kundis den best möglich passenden Wein anzudreh… zu verkaufen.

    Sie haben sich bei Ihrem Bewerbungsgespräch persönlich von der Qualität der Produkte eingehend überzeugt und sind daher hoch motiviert, sich zum Wohle des Unternehmens einzusetzen.

    Kürzlich hat eine Beratungsfirma, die Ihre Kunden im Rahmen einer qualitativen Studie untersucht hat, herausgefunden, dass doch ein beachtlicher Teil von einem Menschen, nicht von einem Roboter (bzw. der KI) beim Wein aussuchen beraten werden möchte. Diesen Anteil von Kunden (die nicht von der KI beraten werden möchten) möchten Sie jetzt genauer bestimmen.

    Dazu haben Sie N=42N=42 Kundis befragt. Gut die Hälfte (n=23n=23) hat sich zugunsten der KI ausgesprochen; der Rest der Kundis möchte lieber von einem Menschen beraten werden.

    Gehen Sie im Folgenden davon aus, dass die Studie bzw. die erhaltenen Daten von guter Qualität ist (man also keine Probleme wie mangelnde Repräsentativität erwarten muss).

    Verwenden Sie die Gittermethode und gleichverteilte Priori-Werte.

    1. Wie groß ist die Wahrscheinlichkeit, dass die KI-freundlichen Kundis bei Ihnen überwiegen?

    2. Wie groß ist die Wahrscheinlichkeit (laut Modell), dass künftig eine Mehrheit an KI-freundlichen Kundis zu beobachten sein wird?

    3. Wenn Sie nur eine Zahl angeben dürften: Was ist Ihr Schätzwert zum Anteil der KI-Freunde (in dieser Studie)?