Aufgaben

  1. Aufgabe

    In dieser Aufgabe betrachten wir einige Probleme, die bei der Praxis der Datenanalyse auftauchen.

    Importieren Sie zunächst den Datensatz diamonds, der Teil des Tidyverse ist:

    library(tidyverse)
    data(diamonds)

    Aufgaben

    1. Zählen Sie die fehlenden Werte pro Spalte!
    2. Welcher Anteil von Werten fehlt insgesamt (in der ganzen Tabelle)?
    3. Ersetzen Sie fehlende Werte (numerischer Variablen) durch den Mittelwert!
    4. Welche Variable zeichnet sich durch die höchste Schiefe aus?
    5. Definieren wir “Ausreißer” als einen Wert, der mehr als 3SD-Einheiten vom Mittelwert entfernt ist. Wie viele Ausreißer gibt es für price?
    6. Gibt es Dubletten? Wenn ja, wie viele?
    7. Gibt es Variablen, die konstant oder fast konstant sind? Konstant ist hier definiert als (fast) keine Variabilität.