tidy1

tidy
datawrangling
schoice
Published

February 2, 2023

Aufgabe

Das Konzept von “tidy” Daten (“Tidyformat”) spielt in der Datenanalyse eine wichtige Rolle.

Betrachten Sie die Tabellen im Folgenden. Welche ist “tidy”?

Hinweise:

  • Alle Variablen sollen nicht konstant sein, also mehr als einen uniquen Wert aufweisen.
  • Alle Variablen sollen keine fehlenden Werte aufweisen, also komplett sein.
  • Alle Variablen sollen numerisch sein.

Tabelle A:

Tabelle A
group y id1 id2
1 10 A 1
2 20 B 1
1 30 C 2
2 40 D 2

Tabelle B:

Tabelle B
group y id1 id2
1 10 1 1
2 20 1 1
1 30 1 2
2 40 1 2

Tabelle C:

Tabelle C
group y id1 id2
1 10 1 1
2 20 2 1
1 30 3 2
2 40 4 2

Tabelle D:

Tabelle D
group y id1 id2
1 10 1,2 1
2 20 id1 1
1 30 id1 2
2 40 id1 2

Tabelle E:

Tabelle E
group y id1 id2
1 10 1,2 1
2 20 1,2 1
1 30 1,2 2
2 40 1,2 2

Answerlist

  • Tabelle A
  • Tabelle B
  • Tabelle C
  • Tabelle D
  • Tabelle E











Lösung

Answerlist

  • Falsch. Alle Werte sollen numerisch sein
  • Falsch. Variablen sollen nicht konstant sein.
  • Richtig. Das ist ein ‘tidy Tibble’.
  • Falsch. Die Spalte id1weißt einen nicht erlaubten Wert auf.
  • Falsch. In einer Zelle darf nur ein (numerischer) Wert stehen.

Categories:

  • tidy
  • datawrangling
  • schoice