nasa01

data

eda

lagemaße

variability

string

Published

April 28, 2023

Aufgabe

Viele Quellen berichten Klimadaten unserer Erde, z.B. auch National Aeronautics and Space Administration - Goddard Institute for Space Studies.

Von dieser Quelle beziehen wir diesen Datensatz.

Die Datensatz sind auf der Webseite wie folgt beschrieben:

Tables of Global and Hemispheric Monthly Means and Zonal Annual Means

Combined Land-Surface Air and Sea-Surface Water Temperature Anomalies (Land-Ocean Temperature Index, L-OTI)

The following are plain-text files in tabular format of temperature anomalies, i.e. deviations from the corresponding 1951-1980 means.

Global-mean monthly, seasonal, and annual means, 1880-present, updated through most recent month: TXT, CSV

Starten Sie zunächst das R-Paket tidyverse falls noch nicht geschehen.

library(tidyverse)

Importieren Sie dann die Daten:

data_path <- "https://data.giss.nasa.gov/gistemp/tabledata_v4/GLB.Ts+dSST.csv"
d <- read.csv(data_path, skip = 1)

Wir lassen die 1. Zeile des Datensatzes aus (Argument skip), da dort Metadaten stehen, also keine Daten, sondern Informationen (Daten) zu den eigentlichen Daten.

Aufgabe

Berechnen und visualisieren Sie die folgende Statistiken pro Dekade:

Mittelwert der Temperatur im Januar
SD der Temperatur im Januar

Hinweise:

Sie müssen zuerst die Dekade als neue Spalte berechnen.

Lösung

Setup

library(ggpubr)
library(DataExplorer)

Daten aufbereiten

Dekade berechnen:

d <-
  d %>% 
  mutate(decade = round(Year/10))

Das ist ein möglicher Weg, um aus einer Jahreszahl die Dekade zu berechnen.

Statistiken berechnen

Statistiken pro Dekade:

d_summarized <- 
  d %>% 
  group_by(decade) %>% 
  summarise(temp_mean = mean(Jan),
            temp_sd = sd(Jan))

d_summarized

decade	temp_mean	temp_sd
188	−0.20	0.24
189	−0.44	0.22
190	−0.26	0.16
191	−0.39	0.22
192	−0.28	0.15
193	−0.14	0.22
194	0.03	0.21
195	−0.05	0.18
196	0.03	0.15
197	−0.07	0.17
198	0.21	0.19
199	0.35	0.13
200	0.52	0.19
201	0.64	0.21
202	0.98	0.15

Statistiken visualisieren

Mit `DataExplorer`

d_summarized |> 
  select(decade, temp_mean) |> 
  plot_scatterplot(by = "temp_mean")

d_summarized |> 
  select(decade, temp_sd) |> 
  plot_scatterplot(by = "temp_sd")

Mit `ggpubr`

d_summarized |> 
  ggline(x = "decade", y = "temp_mean")

d_summarized |> 
  ggline(x = "decade", y = "temp_sd")

d  |> 
  ggerrorplot(x = "decade", y = "Jan")

Falls Sie Teile der R-Syntax nicht kennen: Machen Sie sich nichts daraus. 😄

Categories:

data
eda
lagemaße
variability
string

--- extype: string exsolution: NA exname: nasa01 expoints: 1 categories: - data - eda - lagemaße - variability - string date: '2023-04-28' slug: nasa01 title: nasa01 --- ```{r global-knitr-options, include=FALSE} knitr::opts_chunk$set( fig.pos = 'H', fig.asp = 0.618, fig.align='center', fig.width = 5, out.width = "100%", fig.cap = "", fig.path = "chunk-img/", dpi = 300, # tidy = TRUE, echo = TRUE, message = FALSE, warning = FALSE, cache = FALSE, fig.show = "hold") ``` # Aufgabe Viele Quellen berichten Klimadaten unserer Erde, z.B. auch [National Aeronautics and Space Administration - Goddard Institute for Space Studies](https://data.giss.nasa.gov/gistemp/). Von dieser Quelle beziehen wir [diesen Datensatz](https://data.giss.nasa.gov/gistemp/tabledata_v4/GLB.Ts+dSST.csv). Die Datensatz sind auf der Webseite wie folgt beschrieben: *Tables of Global and Hemispheric Monthly Means and Zonal Annual Means* Combined Land-Surface Air and Sea-Surface Water Temperature Anomalies (Land-Ocean Temperature Index, L-OTI) The following are plain-text files in tabular format of temperature anomalies, i.e. *deviations from the corresponding 1951-1980 means*. > Global-mean monthly, seasonal, and annual means, 1880-present, updated through most recent month: TXT, CSV Starten Sie zunächst das R-Paket `tidyverse` falls noch nicht geschehen. ```{r message = FALSE} library(tidyverse) ``` Importieren Sie dann die Daten: ```{r} data_path <- "https://data.giss.nasa.gov/gistemp/tabledata_v4/GLB.Ts+dSST.csv" d <- read.csv(data_path, skip = 1) ``` Wir lassen die 1. Zeile des Datensatzes aus (Argument `skip`), da dort *Metadaten* stehen, also keine Daten, sondern Informationen (Daten) zu den eigentlichen Daten. **Aufgabe** Berechnen und visualisieren Sie die folgende Statistiken pro Dekade: 1. Mittelwert der Temperatur im Januar 2. SD der Temperatur im Januar Hinweise: - Sie müssen zuerst die Dekade als neue Spalte berechnen. # Lösung ## Setup ```{r} library(ggpubr) library(DataExplorer) ``` ## Daten aufbereiten Dekade berechnen: ```{r} d <- d %>% mutate(decade = round(Year/10)) ``` Das ist *ein möglicher* Weg, um aus einer Jahreszahl die Dekade zu berechnen. ## Statistiken berechnen Statistiken pro Dekade: ```{r results ='hide'} d_summarized <- d %>% group_by(decade) %>% summarise(temp_mean = mean(Jan), temp_sd = sd(Jan)) d_summarized ``` ```{r echo = FALSE} d_summarized %>% gt::gt() %>% gt::fmt_number(c(2,3)) ``` ## Statistiken visualisieren ### Mit `DataExplorer` ```{r} d_summarized |> select(decade, temp_mean) |> plot_scatterplot(by = "temp_mean") d_summarized |> select(decade, temp_sd) |> plot_scatterplot(by = "temp_sd") ``` ### Mit `ggpubr` ```{r} d_summarized |> ggline(x = "decade", y = "temp_mean") d_summarized |> ggline(x = "decade", y = "temp_sd") ``` ```{r} d |> ggerrorplot(x = "decade", y = "Jan") ``` Falls Sie Teile der R-Syntax nicht kennen: Machen Sie sich nichts daraus. 😄 --- Categories: - data - eda - lagemaße - variability - string