Aufgabe
In dieser Aufgabe betrachten wir einige Probleme, die bei der Praxis
der Datenanalyse auftauchen.
Importieren Sie zunächst den Datensatz diamonds
, der
Teil des Tidyverse ist:
library(tidyverse)
data(diamonds)
Aufgaben
- Zählen Sie die fehlenden Werte pro Spalte!
- Welcher Anteil von Werten fehlt insgesamt (in der ganzen
Tabelle)?
- Ersetzen Sie fehlende Werte (numerischer Variablen) durch
den Mittelwert!
- Welche Variable zeichnet sich durch die höchste Schiefe
aus?
- Definieren wir “Ausreißer” als einen Wert, der mehr als
3SD-Einheiten vom Mittelwert entfernt ist. Wie viele Ausreißer gibt es
für
price
?
- Gibt es Dubletten? Wenn ja, wie viele?
- Gibt es Variablen, die konstant oder fast konstant
sind? Konstant ist hier definiert als (fast) keine Variabilität.