Im Hinblick auf die lineare Regression: Welche der folgenden Aussage passt am besten?
Die folgende Frage bezieht sich auf dieses Ergebnis einer Regressionsanalyse:
Call:
lm(formula = y ~ x, data = d)
Residuals:
Min
-5.60103138447483762
1Q
-1.29651399607992146
Median
0.13271312910725397
3Q
1.34069454220904838
Max
3.27668181652550139
Coefficients:
Estimate
(Intercept) -0.20266077940008262
x 1.21128727626050403
Std. Error
(Intercept) 0.27557847442282846
x 0.24999438472545932
t value
(Intercept) -0.73540000000000005
x 4.84525999999999968
Pr(>|t|)
(Intercept) 0.46546
x 0.000012216 ***
---
Signif. codes: 0 '***'
0.0010000000000000000208 '**'
0.010000000000000000208 '*'
0.050000000000000002776 '.'
0.10000000000000000555 ' ' 1
Residual standard error: 1.9994569675161675271 on 51 degrees of freedom
Multiple R-squared: 0.31522046211193527, Adjusted R-squared: 0.30179341234942414
F-statistic: 23.476524455286146 on 1 and 51 DF, p-value: 0.000012216495740867034
Welche der folgenden Aussagen passt am besten?
x
um 1 Einheit steigt, dann kann eine Veränderung um etwa 1.21 Einheiten in y
erwartet werden (nicht kausal zu verstehen).
y
sinkt mit zunehmenden x
.
x=1
, dann ist ein Mittelwert von y
in Höhe von ca. -0.2 zu erwarten.
x=2
, dann ist ein Mittelwert von y
in Höhe von ca. 1.01 zu erwarten.
Ein Streudiagramm von und ergibt folgende Abbildung:
Wählen Sie das am besten passende Modell aus der Liste aus!
Welcher R-Code passt am besten, um folgende Frage aus der Post-Verteilung herauszulesen:
Hinweise:
a
ist der Achsenabschnitt, b
ist das Regressionsgewicht.post_tab_df
ist eine Tabelle (in Form eines R-Dataframe), die die Stichproben aus der Post-Verteilung enthält.Code A
post_tab_df %>%
count(gross = a == 155) %>%
mutate(prop = n / sum(n))
Code B
post_tab_df %>%
count(gross = a > 155) %>%
mutate(prop = n / sum(n))
Code C
post_tab_df %>%
count(gross = a <= 155) %>%
mutate(prop = n / sum(n))
Code D
post_tab_df %>%
count(gross = a >= 155) %>%
mutate(prop = n / sum(n))
Code E
post_tab_df %>%
count(gross = a < 155) %>%
mutate(prop = n / sum(n))
Betrachten wir den biologisch fundierten Zusammenhang von Gewicht und Körpergröße.
Welche der folgenden Priori-Verteilungen passt am besten für ?
Gehen Sie von z-standardisierten Variablen aus.
Ei Forschi wählt für ein Regressionsmodell (Priori), wobei die empirischen Variablen z-standardisiert sind. Beziehen Sie Stellung zu diesem Prior.
Beziehen Sie sich auf das Regressionsmodell, für das die Ausgabe mit stan_glm()
hier dargestellt ist:
## stan_glm
## family: gaussian [identity]
## formula: height ~ weight_c
## observations: 346
## predictors: 2
## ------
## Median MAD_SD
## (Intercept) 154.6 0.3
## weight_c 0.9 0.0
##
## Auxiliary parameter(s):
## Median MAD_SD
## sigma 5.1 0.2
Betrachten Sie wieder folgende Beziehung (Gleichung bzw. Ungleichung):
Die in der obigen Beziehung angebenen Parameter beziehen sich auf das oben dargestellt Modell.
Ergänzen Sie das korrekte Zeichen in das Rechteck !
Was ist nicht Ziel oder Gegenstand einer Bayes-Analyse?
Der Likelihood eines Datensatzes ist definiert als das Produkt der Likelihoods aller Beobachtungen:
wobei die Beobachtungen bzw. ihre Likelihood als unabhängig angenommen werden: .
Je größer , desto …….. !
Füllen Sie die Lücke!
Welche Zeile der folgenden Modellspezifikation zeigt den Likelihood?
Zeile …
Sie möchten, im Rahmen einer Studie, ein einfaches lineare Modell spezifizieren, d.h. den Likelihood und die Priori-Verteilungen benennen.
Folgende Informationen sind gegeben:
einnahmen
werbebudget
Schreiben Sie in mathematischer Notation folgende Notation auf:
Die Priori-Verteilung des Regressionsgewichts
Hinweise:
b
, mit a
und mit s
.~
um stochastische Relationen (Verteilungen) anzuzeigen.Normal(x;y)
und Exponentialverteilung al Exp(x)
an (jeweils mit den korrekten Argumenten in der allgemein üblichen Form).Sie möchten, im Rahmen einer Studie, ein einfaches lineare Modell spezifizieren, d.h. den Likelihood und die Priori-Verteilungen benennen.
Folgende Informationen sind gegeben:
einnahmen
werbebudget
Schreiben Sie in mathematischer Notation folgende Notation auf:
Priori-Verteilung der Streuung der AV
Hinweise:
b
, mit a
und mit s
.~
um stochastische Relationen (Verteilungen) anzuzeigen.Normal(x;y)
und Exponentialverteilung al Exp(x)
an (jeweils mit den korrekten Argumenten in der allgemein üblichen Form).Nach der Berechnung bzw. Schätzung der Modellparameter ein)es Regressionsmodells (mit Methoden der Bayes-Inferenz) erhält man u.a. auf die Prädiktorwerte () bedingte Wahrscheinlichkeiten für die AV, , oder genauer (mit für die Modellparameter).
Betrachten Sie dazu folgende Aussage:
für
Welche der Aussagen ist in diesem Zusammenhang falsch?