Regression6

dyn
regression
exam-22
schoice
Published

May 8, 2023

Aufgabe

Gegeben sei ein Datensatz mit folgenden Prädiktoren, wobei Studierende die Beobachtungseinheit darstellen:

  • \(X_1\): Muttersprachler (0: nein, 1: ja)
  • \(X_2\): Letzte Mathenote (z-Wert)
  • \(X_3\): Matheanteil im Studium (z-Wert)
  • \(X_4\): Interaktion von \(X1\) und \(X2\)

Die vorherzusagende Variable (\(Y\); Kriterium) ist Gehalt nach Studienabschluss.

Folgende Modellparameter einer Regression (Least Squares, mit lm()) seien gegeben:

  • \(\beta_0: 30\)
  • \(\beta_1: 10\)
  • \(\beta_2: 5\)
  • \(\beta_3: 1\)
  • \(\beta_4: 1\)

Welche der Aussagen ist korrekt?

Answerlist

  • Für einen bestimmten (festen) Wert von \(X_2=\) Letzte Mathenote (z-Wert) und \(X_3=\) Matheanteil im Studium (z-Wert) gilt, dass das erwartete Gehalt im Mittel höher ist bei \(X_1=1\) im Vergleich zu \(X_1=0\), laut dem Modell.

  • Für einen bestimmten (festen) Wert von \(X_2\)= Letzte Mathenote (z-Wert) und \(X_3\)= Matheanteil im Studium (z-Wert) gilt, dass das erwartete Gehalt im Mittel höher ist bei \(X_1=0\) im Vergleich zu \(X_1=1\), laut dem Modell.

  • Der mittlere erwartete Gehaltsunterschied \(Y\) zweier Personen \(a\) und \(b\), wobei bei Person \(a\) gilt \(X_1=0\) und bei Person \(b\) gilt \(X_1=1\), beträgt stets \(30\), laut dem Modell.

  • Der mittlere erwartete Gehaltsunterschied \(Y\) zweier Personen \(a\) und \(b\), wobei bei Person \(a\) gilt \(X_2=0\) und bei Person \(b\) gilt \(X_2=1\), beträgt stets \(30\), laut dem Modell.

  • Der mittlere erwartete Gehaltsunterschied von Menschen ist eine Wirkung von genau drei Ursachen: Muttersprachler (0: nein, 1: ja), Letzte Mathenote (z-Wert), Matheanteil im Studium (z-Wert), laut dem Modell.











Lösung

Der Wert des Kriteriums (\(y\)) ist durch folgende Gleichung gegeben:

\(y=\beta_0 + \beta_1 x_1 + \beta_2 x_2 + \beta_3 x_3 + \beta_4 x_1x_2\).

Alle Regressionsgewichte (\(\beta\)) sind positiv, daher ist \(y\) je größer, desto höher die Prädiktorwerte sind.

Hält man einige \(x_2\) und \(x_3\) konstant (fest, fix), so wird daher die Gruppe mit \(x_1=1\) höhere Werte in \(y\) aufweisen als die Gruppe mit \(x_1=0\).

Answerlist

  • Wahr. \(X_1\) ist positiv. Daher hat Gruppe \(X_1=1\) höhere erwartete Werte als \(X_1=0\).
  • Falsch. Diese Option sagt das Gegenteil wie die fast gleich lautende (aber richtige) Antwortoption.
  • Falsch. Der Unterschied in der AV ist von mehreren UV abhängig. Bei Kenntnis des Wertes nur einer UV kann nicht sicher auf den erwarteten Wert der AV geschlossen werden.
  • Falsch. Der Unterschied in der AV ist von mehreren UV abhängig. Bei Kenntnis des Wertes nur einer UV kann nicht sicher auf den erwarteten Wert der AV geschlossen werden.
  • Falsch. Ein Regressionsmodell ist nicht automatisch ein Kausalmodell.

Categories:

  • dyn
  • regression
  • exam-22
  • schoice