library(tidyverse)
library(DataExplorer)
movies-vis2
vis
eda
string
Aufgabe
Importieren Sie bitte für diese Aufgabe den Datensatz movies (aus dem R-Paket ggplot2movies
). Ein Data-Dictionary findet sich hier.
Erstellen Sie folgende Visualisierung:
- Gruppenvergleich des Budgets pro Jahr
- Berücksichtigen Sie nur Actionfilme ab 2000
- Verzichten Sie auf Filme mit einer unterdurchschnittlichen Zahl an Bewertungen (
votes
; gemessen an allen Filmen, gerundet zur nächsten ganzen Zahl)
Lösung
Pakete starten:
Daten importieren:
<- "https://vincentarelbundock.github.io/Rdatasets/csv/ggplot2movies/movies.csv"
d_path <- read.csv(d_path) d
Durchschnittliche Zahl an Bewertungen:
%>%
d summarise(votes_mean = mean(votes))
votes_mean
1 632.1304
Die durchschnittliche Zahl an Bewertungen beträgt also 632.
%>%
d select(budget, rating, year, votes, Action) %>%
filter(year >= 2000) %>%
filter(Action == 1) %>%
filter(votes >= 632) %>%
select(-Action) %>%
mutate(year = factor(year)) %>%
select(budget, year) %>%
plot_boxplot(by = "year")
Warning: Removed 66 rows containing non-finite outside the scale range
(`stat_boxplot()`).
Hinweis: Die Zahl “5.0e+07” ist eine Zahl in der Exponenzial-Schreibweise, nämlich \(5\cdot10^7\), also \(5 \cdot 1000000\).
Categories:
- vis
- eda
- string