Kapitel 6 Diagramme
Man kann tolle Diagramme in R erstellen, aber es braucht etwas Arbeit. Zumindest mehr als fünf Minuten. Daher machen wir es uns hier bequem, und gehen einen schnelleren Weg, der auch schöne Diagramme in R erzeugt, aber dafür nicht so flexibel ist.
Wir benutzen dafür das R-Paket ggpubr
.
Hier können Sie sich Demos anschauen.
Sieht nicht schlecht aus, oder?
Zuerst müssen wir es installieren. Das geht auf bekanntem Wege. Oder sie verwenden den folgenden Befehl, ist vielleicht komfortabler für Sie, Sie brauchen dann nur Copy-Pasten:
install.packages("ggpubr") # nur einmal
Dann starten wir das Paket durch Anhaken oder wiederum mit einem Befehl:
library("ggpubr")
6.1 Daten importieren
Falls Sie den Datensatz mtcars
nicht geladen haben (er als nicht im Reiter Environment auftaucht),
dann laden Sie den Datensatz noch schnell.2
Sie können einfach die folgende Syntax copy-pasten:
library(rio) # R-Paket "R Import, Expoert" (rio)
<- "https://vincentarelbundock.github.io/Rdatasets/csv/datasets/mtcars.csv"
mtcars_path
<- import(mtcars_path) mtcars
Oder Sie lesen im Kapitel Daten importieren noch einmal nach.
Wenn es funktioniert hat,
dann sollte mtcars
unter Data im Reiter Environment auftauchen,
s. Abb. 6.1.
6.2 Zwei Gruppen vergleichen
Ein Klassiker: Zwei Gruppen vergleichen hinsichtlich ihres Mitelwerts oder Medians. Fangen wir mal damit an:
ggboxplot(mtcars, x = "am", y = "mpg")
Merke: Die Argumente der Funktionen bei den Diagramm-Befehlen im R-Paket ggppubr
sind:
- Name der Tabelle
- x: Variable auf der X-Achse
- y: Variable auf der Y-Achse
- sonstiges
Als nächstes, sehr ähnliches Diagramm, probieren wir ein Violinenplot. Aber wir ergänzen noch den Mittelwert pro Gruppe (und dieses Mal mit der Anzahl der Zylinder auf der X-Achse):
ggviolin(mtcars, x = "cyl", y = "mpg", add = "mean")
6.3 Streudiagramm
Gibt es wohl einen Zusammenhang von Spritverbrauch mpg
und PS (hp
)?
ggscatter(mtcars, x = "hp", y = "mpg")
Pimp my Diagram:
ggscatter(mtcars,
x = "hp", y = "mpg",
color = "indianred",
add = "reg.line", # linearer Trend (Regression)
title = "Der Zusammenhang von PS und Spritverbrauch",
mean.point = TRUE)
6.4 Convenience FoodDiagramme
Mit dem R-Paket ggstatsplot kann man auf komfortable Art publikationsreife Diagramme erzeugen.
Installieren wir zuerst das Paket:
install.packages("ggstatsplot")
Und dann starten wir es:
library("ggstatsplot")
6.4.1 Gruppenvergleich
ggbetweenstats(mtcars, x = am, y = mpg)
Weitere Hinweise zum Gruppenvergleich finden sich hier.
6.4.2 Streudiagramme
ggscatterstats(mtcars, x = hp, y = mpg)
Wenn Sie folgende Fehlermeldung bekommen:
Error: Package 'ggside' is required for this function to work. Please install it by running install.packages('ggside').
Dann sollten Sie das angefragte Paket, ggside
, noch installieren auf üblichem Weg (ansonsten tut es nicht Not).
Literatur
Streng genommen, ist dieser Schritt nicht nötig, da
mtcars
mit R mitgeliefert wird. Der Übung und der Transparenz halber macht dieser Schritt aber Sinn.↩︎