tidy1

tidy
datawrangling
schoice
Published

February 2, 2023

Aufgabe

Das Konzept von “tidy” Daten (“Tidyformat”) spielt in der Datenanalyse eine wichtige Rolle.

Betrachten Sie die Tabellen im Folgenden. Welche ist “tidy”?

Hinweise:

  • Alle Variablen sollen nicht konstant sein, also mehr als einen uniquen Wert aufweisen.
  • Alle Variablen sollen keine fehlenden Werte aufweisen, also komplett sein.
  • Alle Variablen sollen numerisch sein.

Tabelle A:

Tabelle A
group y id1 id2
1 10 1 1
2 20 2 1
1 30 3 2
2 40 4 2

Tabelle B:

Tabelle B
group y id1 id2
1 1 1 1
2 2 2 1
1 3 3 2
2 NA 4 2

Tabelle C:

Tabelle C
group y id1 id2
1 y 1 1
2 y 2 1
1 y 3 2
2 1,2 4 2

Tabelle D:

Tabelle D
group y id1 id2
1 40 1 1
2 40 2 1
1 40 3 2
2 40 4 2

Tabelle E:

Answerlist

  • Tabelle A
  • Tabelle B
  • Tabelle C
  • Tabelle D
  • Tabelle E











Lösung

Answerlist

  • Richtig. Das ist ein ‘tidy Tibble’.
  • Falsch. Fehlende Werte sind nicht erlaubt
  • Falsch. Die Spalte yweißt einen nicht erlaubten Wert auf.
  • Falsch. Eine Spalte soll nicht aus einem uniquen Wert bestehen.
  • Falsch. In einem Tidy-Tibble darf keine leere Zeile vorkommen.

Categories:

  • tidy
  • datawrangling
  • schoice