Kapitel 6 Diagramme

Man kann tolle Diagramme in R erstellen, aber es braucht etwas Arbeit. Zumindest mehr als fünf Minuten. Daher machen wir es uns hier bequem, und gehen einen schnelleren Weg, der auch schöne Diagramme in R erzeugt, aber dafür nicht so flexibel ist.

Wir benutzen dafür das R-Paket ggpubr. Hier können Sie sich Demos anschauen. Sieht nicht schlecht aus, oder?

Zuerst müssen wir es installieren. Das geht auf bekanntem Wege. Oder sie verwenden den folgenden Befehl, ist vielleicht komfortabler für Sie, Sie brauchen dann nur Copy-Pasten:

install.packages("ggpubr")  # nur einmal

Dann starten wir das Paket durch Anhaken oder wiederum mit einem Befehl:

library("ggpubr")

6.1 Daten importieren

Falls Sie den Datensatz mtcars nicht geladen haben (er als nicht im Reiter Environment auftaucht), dann laden Sie den Datensatz noch schnell.2

Sie können einfach die folgende Syntax copy-pasten:

library(rio)  # R-Paket "R Import, Expoert" (rio)

mtcars_path <- "https://vincentarelbundock.github.io/Rdatasets/csv/datasets/mtcars.csv"

mtcars <- import(mtcars_path)

Oder Sie lesen im Kapitel Daten importieren noch einmal nach.

Wenn es funktioniert hat, dann sollte mtcars unter Data im Reiter Environment auftauchen, s. Abb. 6.1.

So sieht's aus, wenn mtcars verfügbar ist auf Ihrem Computer

Figure 6.1: So sieht’s aus, wenn mtcars verfügbar ist auf Ihrem Computer

6.2 Zwei Gruppen vergleichen

Ein Klassiker: Zwei Gruppen vergleichen hinsichtlich ihres Mitelwerts oder Medians. Fangen wir mal damit an:

ggboxplot(mtcars, x = "am", y = "mpg")

Merke: Die Argumente der Funktionen bei den Diagramm-Befehlen im R-Paket ggppubr sind:

  1. Name der Tabelle
  2. x: Variable auf der X-Achse
  3. y: Variable auf der Y-Achse
  4. sonstiges

Als nächstes, sehr ähnliches Diagramm, probieren wir ein Violinenplot. Aber wir ergänzen noch den Mittelwert pro Gruppe (und dieses Mal mit der Anzahl der Zylinder auf der X-Achse):

ggviolin(mtcars, x = "cyl", y = "mpg", add = "mean")

6.3 Streudiagramm

Gibt es wohl einen Zusammenhang von Spritverbrauch mpg und PS (hp)?

ggscatter(mtcars, x = "hp", y = "mpg")

Pimp my Diagram:

ggscatter(mtcars, 
          x = "hp", y = "mpg", 
          color = "indianred",
          add = "reg.line",  # linearer Trend (Regression)
          title = "Der Zusammenhang von PS und Spritverbrauch",
          mean.point = TRUE)

6.4 Convenience FoodDiagramme

Mit dem R-Paket ggstatsplot kann man auf komfortable Art publikationsreife Diagramme erzeugen.

Installieren wir zuerst das Paket:

install.packages("ggstatsplot")

Und dann starten wir es:

library("ggstatsplot")

6.4.1 Gruppenvergleich

ggbetweenstats(mtcars, x = am, y = mpg)

Weitere Hinweise zum Gruppenvergleich finden sich hier.

6.4.2 Streudiagramme

ggscatterstats(mtcars, x = hp, y = mpg)

Wenn Sie folgende Fehlermeldung bekommen:

Error: Package 'ggside' is required for this function to work. Please install it by running install.packages('ggside').

Dann sollten Sie das angefragte Paket, ggside, noch installieren auf üblichem Weg (ansonsten tut es nicht Not).

Quelle

6.5 Fazit

Ist doch schon recht ansehnlich, für fünf Minuten, oder?

6.6 Literaturhinweise

Kapitel 11 bis 14 in Sauer (2019) geben eine Einführung in Datenvisualisierung mit ggplot2. Ein ganzes (und gutes) Buch zu dem, frei verfügbar, bietet Claus Wilke hier.

knitr::opts_chunk$set(echo = TRUE)

Literatur

Sauer, Sebastian. 2019. Moderne Datenanalyse Mit R: Daten Einlesen, Aufbereiten, Visualisieren Und Modellieren. 1. Auflage 2019. FOM-Edition. Wiesbaden: Springer. https://www.springer.com/de/book/9783658215866.

  1. Streng genommen, ist dieser Schritt nicht nötig, da mtcars mit R mitgeliefert wird. Der Übung und der Transparenz halber macht dieser Schritt aber Sinn.↩︎