class: right, bottom, test, title-slide # Abschluss ## Kapitel 10 --- <style> .center2 { margin: 0; position: absolute; top: 50%; left: 50%; -ms-transform: translate(-50%, -50%); transform: translate(-50%, -50%); } </style> --- name: gliederung ## Gliederung </br> </br> .xlarge[ 1. [Teil 1: Lieblingsfehler](#teil-1) 2. [Teil 2: Kochrezepte](#teil-2) 3. [Teil 3: Kerngedanken Bayes](#teil-3) 4. [Teil 4: Beispiele für Prüfungsaufgaben](#teil-4) 5. [Hinweise](#hinweise) ] --- name: teil-1 class: middle, center # Teil 1 ## Lieblinglingsfehler </br> </br> </br> </br> </br> .left[.footnote[[Gliederung](#gliederung)]] --- ## Lieblingsfehler im Überblick 🤷 - Post-Präd-Verteilung (PPV) und Post-Verteilung verwechseln - Quantile und Verteilungsfunktion verwechseln - Prädiktoren nicht zentrieren, wenn es einen Interaktionsterm gibt - Interaktion falsch interpretieren - Regressionskoeffizienten kausal interpretieren, wenn es keine kausale Fundierung gibt --- ## Post-Präd-Verteilung (PPV) und Post-Verteilung verwechseln 🤷 ```r m1 <- stan_glm(mpg ~ hp, data = mtcars) ``` .pull-left[ Die Post-Verteilung zeigt Stichproben zu den Parameterwerten. ```r post_verteilung <- m1 %>% as_tibble() head(post_verteilung) ``` ``` ## # A tibble: 6 × 3 ## `(Intercept)` hp sigma ## <dbl> <dbl> <dbl> ## 1 27.8 -0.0564 3.76 ## 2 29.7 -0.0633 3.08 ## 3 30.1 -0.0697 4.97 ## 4 31.6 -0.0723 3.06 ## 5 28.2 -0.0559 5.08 ## 6 27.8 -0.0510 4.94 ``` ] .pull-right[ Die PPV zeigt die Vorhersagen, also keine Parameterwerte, sondern Beobachtungen.
name
value
Mazda RX4
24.87113
Mazda RX4 Wag
19.34501
Datsun 710
26.09487
Hornet 4 Drive
24.84667
Hornet Sportabout
23.59572
] --- ## Quantile und Verteilungsfuntion verwechseln 🤷 .pull-left[ ### Quantil für `\(p\)` Ein `\(p\)`-Quantil teilt eine Verteilung in zwei Teile, und zwar so, dass mind. `\(p\)` kleiner oder gleich dem `\(p\)`-Quantil sind. <img src="Kapitel_10_chunk-img/quantil-plot-1.png" width="100%" style="display: block; margin: auto;" /> Das 50%-Quantil (.5-Quantil) beträgt `\(x=0\)`. Mind ein Anteil `\(1-p\)` ist größer oder gleich dem `\(p\)`-Quantil. ] .pull-right[ ### Verteilungsfunktion `\(F\)` `\(F(x)\)` gibt die Wahrscheinlichkeit an der Stelle `\(x\)` an, dass `\(X\)` einen Wert kleiner oder gleich `\(x\)` annimmt. <img src="Kapitel_10_chunk-img/f-plot-1.png" width="100%" style="display: block; margin: auto;" /> `\(F(0)=1/2\)`, die Wahrscheinlichkeit beträgt hier 50%, dass `\(x\)` nicht größer ist als 0. ] --- ## Interaktion falsch interpretieren 🤷 ```r m2 <- stan_glm(mpg ~ hp*vs, data = mtcars) # mit Interaktionseffekt ``` Modellkoeffizienten: ``` ## (Intercept) hp vs hp:vs ## 24.75 -0.04 13.67 -0.11 ``` .pull-left[ ### Falsch 😈 Der Unterschied im Verbrauch zwischen den beiden Gruppen `vs=0` und `vs=1` begrägt ca. -0.11. ] .pull-right[ ### Richtig 👼 Der Unterschied im Verbrauch zwischen den beiden Gruppen `vs=0` und `vs=1` beträgt ca. -0.11 -- *wenn* `hp=0`. ] Da `hp=0` kein realistischer Wert ist, ist das Modell schwer zu interpretieren. Zentrierte Prädiktoren wären eine Lösugn. </br> <a name=cite-gelman_regression_2021></a>[Gelman, Hill, and Vehtari (2021, Kap. 10)](#bib-gelman_regression_2021), <a name=cite-mcelreath_statistical_2020></a>[McElreath (2020, Kap. 8)](#bib-mcelreath_statistical_2020) --- name: teil-2 class: middle, center # Teil 2 ## Kochrezepte 🍲 .left[.footnote[[Gliederung](#gliederung)]] --- ## Kochrezept: Forschungsfrage untersuchen *Theoretische Phase* 1. Staunen über ein Phänomen, `\(y\)`, Kausalfrage finden 2. Literatur wälzen, um mögliche Ursachen `\(x\)` von `\(y\)` zu lernen 3. Forschungsfrage, Hypothese präzisieren 4. Modell präzisieren (DAG(s), Prioris) *Empirische Phase* 5. Versuch planen 6. Daten erheben *Analytische Phase* 7. Daten aufbereiten 8. Modell berechnen anhand eines oder mehrerer DAGs 9. Modell prüfen/kritisieren 10. Forschungsfrage beantworten Yeah! Fertig. --- ## Parameter schätzen vs. Hypothesen prüfen - Quantitative Studien haben oft einen von zwei (formalen) Zielen: Hypothesen testen oder Parameter schätzen. - Beispiel Hypothesenprüfung: "Frauen parken im Durchschnitt schneller ein als Männer". - Beispiel Parameterschätzung: "Wie groß ist der mittlere Unterschied in der Ausparkzeit zwischen Frauen und Männern?" - Je ausgereifter ein Forschungsfeld, desto *kühnere* Hypothesen lassen sich formulieren: - stark ausgereift: - Die nächste totale Sonnenfinsternis in Deutschland wird am 27.7.2082 um 14.47h stattfinden, [Quelle](https://www.solar-eclipse.info/de/eclipse/country/DE/) - gering ausgereift: - Die nächste Sonnenfinsternis wird in den nächsten 100 Jahren stattfinden. - Lernen bringt mehr als Nicht-Lernen für den Klausurerfolg. - Kühne Hypothesen sind wünschenswert. --- ## Formalisierung von Forschungsfragen - Der Mittelwert in Gruppe A ist höher als in Gruppe B (der Unterschied, `\(d\)`, im Mittelwert ist größer als Null): `$$\mu_1 > \mu_2 \Leftrightarrow \mu_1 - \mu_2 > 0 \Leftrightarrow \mu_d > 0$$` - Die Korrelation zwischen A und B ist positiv: `$$\rho(A,B) > 0$$` - Das Regressionsgewicht von `\(x_1\)` ist größer als `\(k\)` (nicht vernachlässigbar): `$$\beta_{x_1} > k$$` --- ## ROPE als guter Einstieg Das Rope-Konzept ist ein guter Weg, um eine Theorie bzw. eine Hypothese aus einer Theorie zu prüfen: 1. Leiten Sie aus der Theorie ab, wie groß der Effekt mindestens sein muss, `\(k\)` 2. Prüfen Sie dann, ob der Hauptteil der Post-Verteilung, z.B. das 95%-PI, - komplett innerhalb, - komplett außerhalb, - oder teils innerhalb teils außerhalb des ROPE liegt. 3. Auf dieser Basis - bestätigen Sie die Nullhypothese - verwerfen Sie die Nullhtypothese - enthalten Sie sich einer Entscheidung bzgl. der Nullhypothese - Nullhypothesen zu testen ist verbreitet in der Frequentistischen Statistik. - Das ROPE-Konzept bietet ein analoges Verfahren auf Basis der Bayes-Statistik. - Daher ist das ROPE nützlich besonders wenn Anschlussfähigkeit zur Frequentistischen Statistik gefragt ist (z.B. wenn ein Publikum die Frequentistische Statistik gewohnt ist bzw. die Bayes-Statistik nicht kennt). - Im Frequentismus benutzt man oft den *p-Wert*, um über eine Nullhypothese zu unterscheiden: `\(p < .05\)` führt zum Verwerfen einer Nullhypothesen, `\(p \ge .05\)` führt zum Beibehalten. --- ## Übersetzung einer Hypothese in ein Regressionsterm Vergleich zweier Gruppenmittelwerte: `$$\mu_1 > \mu_2 \Leftrightarrow \mu_1 - \mu_2 > 0 \Leftrightarrow \mu_d > 0$$` .center[`y ~ b`] --- Vergleich von `\(g\)` Gruppenmittelwerte: `$$\mu_1 \ne \mu_2 \ne \ldots \ne \mu_g$$` .center[`y ~ g`] --- Prüfung auf eine positive Assoziation von `\(X\)` mit `\(Y\)`: `$$\beta_x > 0$$` .center[`y ~ m`] Legende: `b`: binäre Variable (0/1); `g`: nominale Variable (Gruppierungsvariable) mit zwei oder mehr Stufen; `y`: metrisches Kriterium der Regression (AV); `x`: Beliebiger Prädiktor einer Regression; `m`: metrischer Prädiktor --- ## Übersetzung Frequentistischer Verfahren in Regressionsterme
Regressionsterm
Freqentistischer.Test
y ~ b
t-Test (Vergleich zweier Gruppen)
y ~ g
Varianzanalyse
y ~ g + m
Kovarianzanalyse
b ~ g
Chi-Quadrat-Test
y_z ~ x_z
Korrelationstest
y ~ 1
Mittelwert schätzen (t-Test)
b ~ 1
Anteil schätzen
y ~ x + g + x:g
Interaktion
y ~ x*g
Interaktion
Legende: s. vorherige Seite; `y_z` bzw. `x_z`: z-standardisierte Variable --- name: teil-3 class: middle, center # Teil 3 ## Kerngedanken Bayes .left[.footnote[[Gliederung](#gliederung)]] --- ## Zentraler Kennwert der Bayes-Statistik: Post-Verteilung ```r m3 <- stan_glm(mpg ~ hp, data = mtcars) ``` .pull-left[ <img src="Kapitel_10_chunk-img/unnamed-chunk-10-1.png" width="100%" style="display: block; margin: auto;" /> ] .pull-right[ - Ein Zusammenfassen der Posterior-Verteilung (z.B. zu einem 95%-PI) ist möglich und oft sinnvoll. - Verschiedene Arten des Zusammenfassens der Post-Verteilung sind möglich, z.B. zu Mittelwert oder SD oder einem einem HD-Intervall. - Allerdings übermittelt nur die gesamte Post-Verteilung alle Informationen. - Daher empfiehlt es sich (oft), die Post-Verteilung zu visualisieren. ] --- ## Posteriori als Produkt von Priori und Likelihood `$$\text{Posteriori} = \frac{\text{Likelihood} \times \text{Priori}}{\text{Evidenz}}$$` <img src="Kapitel_10_chunk-img/QM2-Thema10-kleineModelle-27-ref-1.png" width="100%" style="display: block; margin: auto;" /> --- ## Bayes' Theorem `$$Pr(H|D) = \frac{Pr(D|H) Pr(H)}{Pr(D)}$$` - Bestandteile: - Posteriori-Wahrscheinlichkeit: `\(Pr_{Post} := Pr(H|D)\)` - Likelihood: `\(L := Pr(D|H)\)` - Priori-Wahrscheinlichkeit: `\(Pr_{Priori} := Pr(H)\)` - Evidenz: `\(E := Pr(D)\)` - Bayes' Theorem gibt die `\(Pr_{Post}\)` an, wenn man die Gleichung mit der `\(Pr_{Priori}\)` und dem `\(L\)` füttert. - Bayes' Theorem wird häufig verwendet, um die `\(Pr_{Post}\)` zu quantifizieren. - Die `\(Pr_{Post}\)` ist proportional zu `\(L \times Pr_{Priori}\)`. --- ## Wissen updaten: Wir füttern Daten in das Modell <img src="Kapitel_10_chunk-img/QM2-Thema2-kleineModelle-19-ref-1.png" width="100%" style="display: block; margin: auto;" /> --- ## So denkt unser Bayes-Golem <img src="Kapitel_10_chunk-img/dagbayes-1.png" width="100%" style="display: block; margin: auto;" /> --- ## Statistisches Modellieren ist an vielen Stellen subjektiv - Definition des DAG - Wahl der Stichprobe - Wahl der Prädiktoren - Wahl von Transformationen (z.B. Logarithmus) - Wahl von Prioris - Wahl von Intervallgrößen und -arten Dabei meint "subjektiv", dass die Entscheidung nicht datengeleitet, logisch deduziert oder von der Methode diktiert werden. Subjektive Entscheidungen können z.B. - fachlich begründet sein - ein Konsensus der Scientific Community ausdrücken - auf Vorwissen früherer Studien beruhen Generell spricht von *Researchers' degrees of Freedom*, wenn man (negativ konnotiert) Intransparenz in einem wissenschaftlichen Prozess anprangern (aufzeigen) möchten, vgl. [weiterführende Infos](https://en.wikipedia.org/wiki/Researcher_degrees_of_freedom). Das Problem ist aber *nicht* "Subjektivität" - sie ist unumgänglich und oft wünschenswert - sondern Intransparenz über "subjektive" Entscheidungen. --- ## Learn to be a good Bayesian .pull-left[ <img src="https://f4.bcbits.com/img/a0636800374_16.jpg" width="100%" style="display: block; margin: auto;" /> Baba Brinkman [Quelle](https://music.bababrinkman.com/track/good-bayesian-feat-mc-lars-and-mega-ran) ] .pull-right[ ### Good Bayesian .xsmall[ ... Let me show you how to be a good Bayesian Change your predictions after takin’ information in And if you’re thinkin’ I’ll be less than amazin’ Let’s adjust those expectations What’s a Bayesian? It’s someone who cares about evidence And doesn’t jump to assumptions based on intuitions and prejudice A Bayesian makes prediction on the best available info And adjusts the probability, ‘cause every belief is provisional And when I kick a flow, mostly I’m watchin’ eyes widen Maybe ‘cause my likeness lowers expectations of tight rhymin’ How would I know, unless I’m rhymin’ in front of a bunch of blind men? Droppin’ placebo-controlled science like I’m Richard Feynman ... ] from The Rap Guide to Consciousness by Baba Brinkman [YouTube Song](https://www.youtube.com/watch?v=qV6Wc_f1Cgo) ] --- name: teil-4 class: middle, center # Teil 4 ## Beispiele für Prüfungsaufgaben .left[.footnote[[Gliederung](#gliederung)]] --- ## Geben Sie den korrekten Begriff an! </br> </br> </br> </br> .center[ 🌬🚙🙋️👨⬅️Hans 👧⬅️Anna 👩⬅️Lise ] --- ## DAG mit doppelter Konfundierung .pull-left[ <img src="Kapitel_10_chunk-img/dag2-1.png" width="100%" style="display: block; margin: auto;" /> ] .pull-right[ ❓Geben Sie die minimale Adjustierungsmenge (minimal adjustment set) an, um den totalen (gesamten) Effekt von *E* auf *D* zu bestimmen! ❗ Entweder ist die Menge {A,Z} zu adjustieren oder die Menge {B,Z}. ] --- ## DAG mit vielen Variablen <img src="Kapitel_10_chunk-img/dag3-1.png" width="100%" style="display: block; margin: auto;" /> Minimale Adjustierungsmenge, um den Effekt von E auf D zu identifizieren: {7}, {8}. --- ## Ein Kausalmodell der Schizophrenie, van Kampen (2014) *The SSQ model of schizophrenic prodromal unfolding revised:* *An analysis of its causal chains based on the language of directed graphs* D. van Kampen Lesen Sie [hier den Abstract](https://www.cambridge.org/core/journals/european-psychiatry/article/abs/ssq-model-of-schizophrenic-prodromal-unfolding-revised-an-analysis-of-its-causal-chains-based-on-the-language-of-directed-graphs/F2E7BBFC1B392616DB894AFBFABE7818). Folgende Symptome der Schizophrenie wurden gemessen: Social Anxiety (*SAN*), Active Isolation (*AIS*), Affective Flattening (*AFF*), Suspiciousness (*SUS*), Egocentrism (*EGC*), Living in a Fantasy World (*FTW*), Alienation (*ALN*), Apathy (*APA*), Hostility (*HOS*), Cognitive Derailment (*CDR*), Perceptual Aberrations (*PER*), and Delusional Thinking (*DET*) <a name=cite-van_kampen_ssq_2014></a>[van Kampen (2014)](https://www.cambridge.org/core/product/identifier/S0924933800244817/type/journal_article) UV: *SUS*, AV: *EGC* Berechnen Sie die minimale Adjustierungsmenge, um den kausalen Effekt der UV auf die AV zu identifizieren! --- ## DAG von van Kampen (2014) zu den Symptomen der Schizophrenie <img src="Kapitel_10_chunk-img/dag-van-kampen-1.png" width="100%" style="display: block; margin: auto;" /> Minimales Adjustment-Set für den totalen Kausaleffekt: {AIS, ALN} --- name: hinweise class: center, middle, inverse # Hinweise --- ## Zu diesem Skript - Dieses Skript bezieht sich auf folgende [Lehrbücher](#literatur): - Regression and other stories; Statistical Rethinking (jeweils alle behandelten Kapitel) - Dieses Skript wurde erstellt am 2022-01-10 13:44:01. - Lizenz: [MIT-Lizenz](https://github.com/sebastiansauer/QM2-Folien/blob/main/LICENSE) - Autor: Sebastian Sauer. - Um die HTML-Folien korrekt darzustellen, ist eine Internet-Verbindung nötig. - Mit der Taste `?` bekommt man eine Hilfe über Shortcuts für die HTML-Folien. - Wenn Sie die Endung `.html` in der URL mit `.pdf` ersetzen, bekommen Sie die PDF-Version (bzw. HTML-Version) der Datei. - Alternativ können Sie im Browser Chrome die Folien als PDF drucken (klicken Sie auf den entsprechenden Menüpunkt). - Den Quellcode der Skripte finden Sie [hier](https://github.com/sebastiansauer/QM2-Folien/tree/main/Themen). - Eine PDF-Version aus den HTML-Folien kann erzeugt werden, indem man im Chrome-Browser die Webseite druckt (Drucken als PDF). --- name: homepage background-image: url(https://raw.githubusercontent.com/sebastiansauer/QM2-Folien/main/img/outro/img10.jpg) background-size: contain background-position: left .pull-right[ </br> </br> </br> </br> </br> </br> .right[ ### [Homepage](https://sebastiansauer.github.io/bayes-start/) ] ] .left[.footnote[[Gliederung](#gliederung)]] <!-- https://github.com/sebastiansauer/QM2-Folien/blob/main/img/outro/img1.jpg?raw=true --> <!-- ../img/outro/img --> --- name: literatur ## Literatur [Diese](https://sebastiansauer.github.io/QM2-Folien/citations.html) R-Pakete wurden verwendet. .small[ <a name=bib-gelman_regression_2021></a>[Gelman, A., J. Hill, and A. Vehtari](#cite-gelman_regression_2021) (2021). _Regression and other stories_. Analytical methods for social research. Cambridge University Press. <a name=bib-van_kampen_ssq_2014></a>[Kampen, D. van](#cite-van_kampen_ssq_2014) (2014). "The SSQ model of schizophrenic prodromal unfolding revised: An analysis of its causal chains based on the language of directed graphs". In: _European Psychiatry_ 29.7, pp. 437-448. DOI: [10.1016/j.eurpsy.2013.11.001](https://doi.org/10.1016%2Fj.eurpsy.2013.11.001). <a name=bib-mcelreath_statistical_2020></a>[McElreath, R.](#cite-mcelreath_statistical_2020) (2020). _Statistical rethinking: a Bayesian course with examples in R and Stan_. 2nd ed. CRC texts in statistical science. Taylor and Francis, CRC Press. ] ---