Aufgaben

  1. Aufgabe

    Gibt es einen Zusammenhang zwischen “Rauchen” und “Gesundheit”? Berechnen Sie das Odds Ratio von Gesundheit (zu Krankheit) von Nichtrauchern (im Verhältnis zu Rauchern!) in diesen fiktiven Daten.

    Raucher krank gesund
    TRUE 24 1619
    FALSE 173 1321

  2. Aufgabe

    Werten Sie die Häufigkeiten (der Stufen) folgender Variablen aus wie unten beschrieben.

    Datensatz: mtcars.

    Variablen:

    1. Erstellen Sie für jede der genannten Variablen eine univariate Häufigkeitsanalyse (also nur eine Variable).
    2. Erstellen Sie dann für die ersten beiden genannten Variablen eine gemeinsame Häufigkeitsanalyse (bivariat).
    3. Erstellen Sie dann für alle genannten Variablen eine gemeinsame Häufigkeitsanalyse.
    4. Wie viele Gruppen (also Häufigkeitswerte) ergeben sich (theoretisch) in der letzten Auswertung?

  3. Aufgabe

    Betrachten Sie die Balkendiagramme. Welche Balkendiagramm zeigt den stärksten Zusammenhang?


    1. A
    2. B
    3. C
    4. keine Antwort möglich

  4. Aufgabe

    Viele Quellen berichten Klimadaten unserer Erde, z.B. auch National Aeronautics and Space Administration - Goddard Institute for Space Studies.

    Von dieser Quelle beziehen wir diesen Datensatz.

    Die Datensatz sind auf der Webseite wie folgt beschrieben:

    Tables of Global and Hemispheric Monthly Means and Zonal Annual Means

    Combined Land-Surface Air and Sea-Surface Water Temperature Anomalies (Land-Ocean Temperature Index, L-OTI)

    The following are plain-text files in tabular format of temperature anomalies, i.e. deviations from the corresponding 1951-1980 means.

    Global-mean monthly, seasonal, and annual means, 1880-present, updated through most recent month: TXT, CSV

    Starten Sie zunächst das R-Paket tidyverse falls noch nicht geschehen.

    library(tidyverse)

    Importieren Sie dann die Daten:

    data_path <- "https://data.giss.nasa.gov/gistemp/tabledata_v4/GLB.Ts+dSST.csv"
    d <- read_csv(data_path, skip = 1)

    Wir lassen die 1. Zeile des Datensatzes aus (Argument skip), da dort Metadaten stehen, also keine Daten, sondern Informationen (Daten) zu den eigentlichen Daten.

    Aufgabe

    Berechnen Sie die folgende Statistiken pro Dekade:

    Hinweise:


  5. Aufgabe

    Viele Quellen berichten Klimadaten unserer Erde, z.B. auch National Aeronautics and Space Administration - Goddard Institute for Space Studies.

    Von dieser Quelle beziehen wir diesen Datensatz.

    Die Datensatz sind auf der Webseite wie folgt beschrieben:

    Tables of Global and Hemispheric Monthly Means and Zonal Annual Means

    Combined Land-Surface Air and Sea-Surface Water Temperature Anomalies (Land-Ocean Temperature Index, L-OTI)

    The following are plain-text files in tabular format of temperature anomalies, i.e. deviations from the corresponding 1951-1980 means.

    Global-mean monthly, seasonal, and annual means, 1880-present, updated through most recent month: TXT, CSV

    Starten Sie zunächst das R-Paket tidyverse falls noch nicht geschehen.

    library(tidyverse)

    Importieren Sie dann die Daten:

    data_path <- "https://data.giss.nasa.gov/gistemp/tabledata_v4/GLB.Ts+dSST.csv"
    d <- read_csv(data_path, skip = 1)

    Wir lassen die 1. Zeile des Datensatzes aus (Argument skip), da dort Metadaten stehen, also keine Daten, sondern Informationen (Daten) zu den eigentlichen Daten.

    Aufgaben

    Hinweise:


  6. Aufgabe

    Viele Quellen berichten Klimadaten unserer Erde, z.B. auch National Aeronautics and Space Administration - Goddard Institute for Space Studies.

    Von dieser Quelle beziehen wir diesen Datensatz.

    Die Datensatz sind auf der Webseite wie folgt beschrieben:

    Tables of Global and Hemispheric Monthly Means and Zonal Annual Means

    Combined Land-Surface Air and Sea-Surface Water Temperature Anomalies (Land-Ocean Temperature Index, L-OTI)

    The following are plain-text files in tabular format of temperature anomalies, i.e. deviations from the corresponding 1951-1980 means.

    Global-mean monthly, seasonal, and annual means, 1880-present, updated through most recent month: TXT, CSV

    Starten Sie zunächst das R-Paket tidyverse falls noch nicht geschehen.

    library(tidyverse)

    Importieren Sie dann die Daten:

    data_path <- "https://data.giss.nasa.gov/gistemp/tabledata_v4/GLB.Ts+dSST.csv"
    d <- read_csv(data_path, skip = 1)

    Wir lassen die 1. Zeile des Datensatzes aus (Argument skip), da dort Metadaten stehen, also keine Daten, sondern Informationen (Daten) zu den eigentlichen Daten.

    Aufgaben

    Für “Wenn-Dann-Abfragen” eignet sich folgender R-Befehl (als “Pseudocode” dargestellt):

    d %>% 
      mutate(neue_spalte = case_when(
        erste_bedingung_bzw_wenn_teil ~ dann_teil1,
        zweite_bedingung_bzw_zweiter_wenn_teil ~ dann_teil2
      ))

  7. Aufgabe

    ## Warning: The `x` argument of `as_tibble.matrix()` must have unique column names if `.name_repair` is omitted as of tibble 2.0.0.
    ## Using compatibility `.name_repair`.
    ## This warning is displayed once every 8 hours.
    ## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was generated.

    Welcher Korrelationswert (Pearson) beschreibt die Korrelation in den Daten am besten?


    1. r=1r = 1
    2. r=1r = -1
    3. r=0r = 0
    4. r=.8r = .8
    5. r=.8r = -.8

  8. Aufgabe

    Welcher Korrelationswert (Pearson) beschreibt die Korrelation in den Daten am besten?