log-y-regression1

regression
lm
qm2
stats-nutshell
Published

September 4, 2022

Exercise

library(tidyverse)
library(easystats)

In dieser Aufgabe modellieren wir den (kausalen) Effekt von Schulbildung auf das Einkommen.

Importieren Sie zunächst den Datensatz und verschaffen Sie sich einen Überblick.

d_path <- "https://vincentarelbundock.github.io/Rdatasets/csv/Ecdat/Treatment.csv"

d <- data_read(d_path)

Dokumentation und Quellenangaben zum Datensatz finden sich hier.

glimpse(d)
Rows: 2,675
Columns: 11
$ rownames <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18…
$ treat    <lgl> TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, T…
$ age      <int> 37, 30, 27, 33, 22, 23, 32, 22, 19, 21, 18, 27, 17, 19, 27, 2…
$ educ     <int> 11, 12, 11, 8, 9, 12, 11, 16, 9, 13, 8, 10, 7, 10, 13, 10, 12…
$ ethn     <chr> "black", "black", "black", "black", "black", "black", "black"…
$ married  <lgl> TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE,…
$ re74     <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
$ re75     <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
$ re78     <dbl> 9930.05, 24909.50, 7506.15, 289.79, 4056.49, 0.00, 8472.16, 2…
$ u74      <lgl> TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, T…
$ u75      <lgl> TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, T…

Modellieren Sie den Effekt der Bildungsdauer auf das Einkommen! Gehen Sie von einem exponenziellen Zusammenhang der beiden Variablen aus. Um welchen Faktor steigt das Einkommen pro Jahr Bildung (laut Modell)?

Hinweise:

  • Verwenden Sie lm zur Modellierung.
  • Operationalisieren Sie das Einkommen mit der Variable re74.
  • Fügen Sie keine weiteren Variablen dem Modell hinzu.
  • Gehen Sie von einem kausalen Effekt des Prädiktors aus.











Solution

d2 <-
  d %>% 
  filter(re74 > 0) %>% 
  mutate(re74_log = log(re74))
m <- lm(re74_log ~ educ, data = d2)

Hier sind die parameters des Modells.

Parameter Coefficient SE 95% CI t(2327) p
(Intercept) 8.83 0.06 (8.70, 8.95) 142.91 < .001
educ 0.07 4.94e-03 (0.07, 0.08) 15.16 < .001

Für jedes Jahr Bildung steigt das Einkommen also ca. um den Faktor 1.07.

Etwas genauer:

\(\hat{\beta_1} = 0.07\) bedeutet, dass ein Jahr Bildung zu einen erwarteten Unterschied im Einkommen in Höhe von 0.07 in Log-Einkommen führt. Anders gesagt wird das Einkommen um exp(0.07) erhöht. Dabei gilt \(e^{0.07} \approx 1.07\):

exp(0.07)
[1] 1.072508

Die Lösung lautet also: “Pro Jahr Bildung steigt das Einkommen - laut Modell um den Faktor ca. 1.07”.

Man darf dabei nicht vergessen, dass wir wir uns hier auf die Schnelle ein Modell ausgedacht haben. Ob es in Wirklichkeit so ist, wie unser Modell meint, ist eine andere Sache!


Categories:

  • regression
  • lm
  • qm2
  • stats-nutshell