summarise05

datawrangling
eda
tidyverse
dplyr
variability
num
Published

April 28, 2023

Aufgabe

Im Datensatz mariokart:

  1. Gruppieren Sie danach, wie viele Lenkräder bei der Auktion dabei waren.

  2. Fassen Sie die Spalte total_pr zusammen und zwar zur MAA und zum IQR - pro Gruppe!

Geben Sie den erste Wert des IQR als Antwort zurück!











Lösung

Pakete starten:

library(easystats)
# Attaching packages: easystats 0.6.0 (red = needs update)
✔ bayestestR  0.13.1   ✔ correlation 0.8.4 
✔ datawizard  0.9.0    ✔ effectsize  0.8.6 
✔ insight     0.19.6   ✔ modelbased  0.8.6 
✔ performance 0.10.8   ✔ parameters  0.21.3
✔ report      0.5.7    ✖ see         0.8.0 

Restart the R-Session and update packages in red with `easystats::easystats_update()`.
library(tidyverse)  # startet das Paket tidyverse

Daten importieren:

mariokart <- data_read("https://vincentarelbundock.github.io/Rdatasets/csv/openintro/mariokart.csv")

Oder so:

data(mariokart, package = "openintro")  # aus dem Paket "openintro"

Dazu muss das Paket openintro auf Ihrem Computer installiert sein.

Zusammenfassen:

library(DescTools)
mariokart_gruppiert <- group_by(mariokart, wheels)  # Gruppieren
mariokart_klein <- summarise(mariokart_gruppiert, 
                             pr_iqr = IQR(total_pr),
                             pr_maa = mean(abs(total_pr - mean(total_pr))),
                             pr_maa2 = MeanAD(total_pr)
                             )  # zusammenfassen
mariokart_klein
# A tibble: 5 × 4
  wheels pr_iqr pr_maa pr_maa2
   <int>  <dbl>  <dbl>   <dbl>
1      0   7      7.05    7.05
2      1   5.32   3.25    3.25
3      2   7.18  11.9    11.9 
4      3   5.25   5.25    5.25
5      4   0      0       0   

Möchte man den MAA nicht von Hand ausrechnen, so kann man die Funktion MeanAD aus dem Paket DescTools nutzen (Denken Sie daran, dass Sie das Paket einmalig installiert haben müssen.)

Die Lösung lautet: 7.00


Categories:

  • datawrangling
  • eda
  • tidyverse
  • dplyr
  • variability
  • num