Die Varianzanalyse (ANOVA) ist ein inferenzstatistisches Verfahren des Frequentismus. Welches Skalenniveau passt zu diesem Verfahren?
Welches der folgenden Beispiele ist kein Beispiel für eine Nullhypothese?
Der t-Test ist ein inferenzstatistisches Verfahren des Frequentismus. Welches Skalenniveau passt zu diesem Verfahren?
Für Statistiken (Stichprobe) verwendet man meist lateinische Buchstaben; für Parameter (Population) verwendet man entsprechend meist griechische Buchstaben.
Vervollständigen Sie folgende Tabelle entsprechend!
Kennwert | Statistik | Parameter |
---|---|---|
Mittelwert | NA | |
Mittelwertsdifferenz | NA | |
Streuung | sd | NA |
Anteil | p | NA |
Korrelation | r | NA |
Regressionsgewicht | b | NA |
Das Testen von Nullhypothesen wird u.a. deswegen kritisiert, weil die Nullhypothese zumeist apriori als falsch bekannt ist, weswegen es keinen Sinne mache, so die Kritiker, sie zu testen.
Nennen Sie ein Verfahren von John Kruschke, das einen Äquivalenzbereich testet und insofern eine Alternative zum Testen von Nullhypothesen anbietet.
Hinweise:
Wählen Sie das Diagramm, in dem kein Interaktionseffekt (in der Population) vorhanden ist (bzw. wählen Sie Diagramm, dass dies am ehesten darstellt).
Ein Streudiagramm von und ergibt folgende Abbildung:
Wählen Sie das am besten passende Modell aus der Liste aus!
Ein Streudiagramm von und ergibt folgende Abbildung; dabei wird noch die Gruppierungsvariable (mit den Stufen 0
und 1
) berücksichtigt (vgl. Farbe und Form der Punkte). Zur besseren Orientierung ist die Regressionsgerade pro Gruppe eingezeichnet.
Wählen Sie das (für die Population) am besten passende Modell aus der Liste aus!
Hinweis: Ein Interaktionseffekt der Variablen und ist mit gekennzeichnet.
Gegeben sei ein Datensatz mit folgenden Prädiktoren, wobei Studierende die Beobachtungseinheit darstellen:
Die vorherzusagende Variable (; Kriterium) ist Gehalt nach Studienabschluss.
Folgende Modellparameter einer Regression (Least Squares) seien gegeben:
Welche der Aussagen ist korrekt?
Letzte Mathenote (z-Wert)
und Alter (z-Wert)
gilt, dass das Gehalt im Mittel höher ist bei im Vergleich zu , laut dem Modell.
Letzte Mathenote (z-Wert)
und = Alter (z-Wert)
gilt, dass das Gehalt im Mittel höher ist bei im Vergleich zu , laut dem Modell.
Geschlecht_Frau (0: nein, 1: ja)
, Letzte Mathenote (z-Wert)
, Alter (z-Wert)
, laut dem Modell.
Welches Ergebnis hat der R-Befehl posterior_interval()
(R-Paket rstanarm
)?
Wählen Sie die (am besten) passende Antwort aus.
Hinweis:
Betrachten Sie folgende Ausgabe eines Bayesmodell, das mit rstanarm
“gefittet” wurde:
## stan_glm
## family: gaussian [identity]
## formula: price ~ cut
## observations: 1000
## predictors: 5
## ------
## Median MAD_SD
## (Intercept) 4571.7 675.1
## cutGood -570.2 777.2
## cutIdeal -1288.3 688.1
## cutPremium 362.5 709.8
## cutVery Good -807.4 706.3
##
## Auxiliary parameter(s):
## Median MAD_SD
## sigma 3795.0 82.4
Welche Aussage passt (am besten)?
Hinweise:
Berechnet man eine Posteriori-Verteilung mit stan_glm()
, so kann man entweder die schwach informativen Prioriwerte der Standardeinstellung verwenden, oder selber Prioriwerte definieren.
Betrachten Sie dazu dieses Modell:
stan_glm(price ~ cut, data = diamonds,
prior = normal(location = c(100, 100, 100, 100),
scale = c(100, 100, 100, 100)),
prior_intercept = normal(3000, 500))
Welche Aussage dazu passt (am besten)?
prior = normal()
werden Gruppenmittelwerte definiert.
prior_intercept = normal(3000, 500)
wird praktisch eine Gleichverteilung definiert (da die Streuung sehr hoch ist).
Berechnet man eine Posteriori-Verteilung mit stan_glm()
, so kann man entweder die schwach informativen Prioriwerte der Standardeinstellung verwenden, oder selber Prioriwerte definieren.
Betrachten Sie dazu dieses Modell:
stan_glm(price ~ cut, data = diamonds,
prior = normal(location = c(100, 100, 100, 100),
scale = c(100, 100, 100, 100)),
prior_intercept = normal(3000, 500))
Wie viele Parameter gibt es in diesem Modell?
Hinweise:
Sei und .
Berechnen Sie den z-Wert für !
Hinweis:
John Kruschke hat einen (Absolut-)Wert vorschlagen, als Grenze für Regressionskoeffizienten “vernachlässigbarer” Größe.
Nennen Sie diesen Wert!
Hinweise:
Im Datensatz mtcars
: Ist der (mittlere) Unterschied im Spritverbrauch zwischen den beiden Gruppen Automatik vs. Schaltgetriebe vernachlässigbar?
Definieren Sie selber, was “vernachlässigbar klein” bedeutet. Oder greifen Sie auf die Definition “höchstens eine Meile” zurück.
Prüfen Sie rechnerisch, anhand des angegebenen Datensatzes, folgende Behauptung:
Behauptung: “Der Unterschied ist vernachlässigbar klein!”
Wählen Sie die Antwortoption, die am besten zu der obigen Behauptung passt!
Hinweise:
Antwortoptionen:
Einer der (bisher) größten Studien der Untersuchung psychologischer Konsequenzen (oder Korrelate) der Covid-Zeit ist die Studie COVIDiStress.
Im Folgenden sollen Sie folgende Forschungsfrage untersuchen:
Ist der Zusammenhang von Stress (PSS10_avg
, AV) und Neurotizismus (neu
, UV) vernachlässigbar klein?
Den Datensatz können Sie so herunterladen (Achtung, groß):
osf_d_path <- "https://osf.io/cjxua/?action=download"
d <- read_csv(osf_d_path)
## Warning: One or more parsing
## issues, see `problems()` for
## details
Hinweise:
Antwortoptionen
Einer der (bisher) größten Studien der Untersuchung psychologischer Konsequenzen (oder Korrelate) der Covid-Zeit ist die Studie COVIDiStress.
Im Folgenden sollen Sie folgende Forschungsfrage untersuchen:
Forschungsfrage:
Ist der Unterschied zwischen Männern und Frauen (Dem_gender
) im Hinblick zum Zusammenhang von Stress (PSS10_avg
, AV) und Neurotizismus (neu
, UV) vernachlässigbar klein?
Den Datensatz können Sie so herunterladen (Achtung, groß):
osf_d_path <- "https://osf.io/cjxua/?action=download"
d <- read_csv(osf_d_path)
## Warning: One or more parsing
## issues, see `problems()` for
## details
Hinweise:
Antwortoptionen: