haeufigkeit01

datawrangling
eda
count
string
mtcars
Published

March 27, 2023

Aufgabe

Werten Sie die Häufigkeiten (der Stufen) folgender Variablen aus wie unten beschrieben.

Datensatz: mtcars.

Variablen:

  • am
  • cyl
  • vs
  1. Erstellen Sie für jede der genannten Variablen eine univariate Häufigkeitsanalyse (also nur eine Variable).
  2. Erstellen Sie dann für die ersten beiden genannten Variablen eine gemeinsame Häufigkeitsanalyse (bivariat).
  3. Erstellen Sie dann für alle genannten Variablen eine gemeinsame Häufigkeitsanalyse.
  4. Wie viele Gruppen (also Häufigkeitswerte) ergeben sich (theoretisch) in der letzten Auswertung?











Lösung

library("tidyverse")
data("mtcars")
  1. univariate Häufigkeitsanalyse
mtcars %>% 
  group_by(am) %>% 
  summarise(zeilen_n = n())
# A tibble: 2 × 2
     am zeilen_n
  <dbl>    <int>
1     0       19
2     1       13

Der Befehle n() gibt die Anzahl der Zeilen (Reihen) zurück. Da in einem Dataframe alle Zeilen gleich lang sind, brauchen wir keine Spalte anzugeben.

Alternativ könnte man auch schreiben:

mtcars %>% 
  count(am)
  am  n
1  0 19
2  1 13

Das ist haargenau der gleiche Effekt wie die vorherige Syntax.

Üblich ist auch, eine Kontingenztabelle so darzustellen:

  1. gemeinsame Häufigkeitsanalyse (bivariat)
mtcars %>% 
  count(am, cyl)
  am cyl  n
1  0   4  3
2  0   6  4
3  0   8 12
4  1   4  8
5  1   6  3
6  1   8  2
table(mtcars$am, mtcars$cyl)
   
     4  6  8
  0  3  4 12
  1  8  3  2

Wir sehen, dass wir \(2\cdot3=6\) Gruppen haben, in denen sich die \(n=32\) Beobachtungen aufteilen.

  1. Häufigkeitsanalyse mit 3 Variablen
mtcars %>% 
  count(am, cyl, vs)
  am cyl vs  n
1  0   4  1  3
2  0   6  1  4
3  0   8  0 12
4  1   4  0  1
5  1   4  1  7
6  1   6  0  3
7  1   8  0  2

Das sind drei Variablen mit \(2 \cdot 3 \cdot 2 = 12\) Gruppen.

Da einige der 12 Gruppen in den Daten nicht vorkommen, sind sie in der Auszählung der Häufigkeiten nicht aufgenommen; in den Daten gibt es nur 7 der 12 Gruppen.


Categories:

  • datawrangling
  • eda
  • count
  • string