Zu diesem Buch
0.1 Was Sie hier lernen und wozu das gut ist
Alle Welt spricht von Big Data, aber ohne die Analyse sind die großen Daten nur großes Rauschen. Was letztlich interessiert, sind die Erkenntnisse, die Einblicke, nicht die Daten an sich. Dabei ist es egal, ob die Daten groß oder klein sind. Natürlich erlauben die heutigen Datenmengen im Verbund mit leistungsfähigen Rechnern und neuen Analysemethoden ein Verständnis, das vor Kurzem noch nicht möglich war. Und wir stehen erst am Anfang dieser Entwicklung. Vielleicht handelt es sich bei diesem Feld um eines der dynamischsten Fachgebiete der heutigen Zeit. Sie sind dabei: Sie lernen einiges Handwerkszeugs des “Datenwissenschaftlers”. Wir konzentrieren uns auf das vielleicht bekannteste Teilgebiet: Ereignisse vorhersagen auf Basis von hoch strukturierten Daten und geeigneter Algorithmen und Verfahren. Nach diesem Kurs sollten Sie in der Lage sein, typisches Gebabbel des Fachgebiet mit Lässigkeit mitzumachen. Ach ja, und mit einigem Erfolg Vorhersagemodelle entwickeln.
0.3 Download des Buches
Sie können verschiedene Versionen des Buches beziehen. Aktuell sind das diese:
Bitte beachten Sie aber, dass diese “schockgefrorenen” Versionen u.U. weniger aktuell sind. Tipp: Vergleichen Sie die Erstellungsdaten der jeweiligen Dokumente.
0.4 Technische Details
Diese Version des Buches wurde erstellt am: 2022-07-11 10:45:12
Die URL zu diesem Buch lautet https://sebastiansauer.github.io/datascience1/ und ist bei GitHub Pages gehostet.
Lesen Sie sich die folgenden Informationen bitte gut durch: Hinweise
Den Quellcode finden Sie in diesem Github-Repo.
Sie haben Feedback, Fehlerhinweise oder Wünsche zur Weiterentwicklung? Am besten stellen Sie hier einen Issue ein.
Dieses Projekt steht unter der MIT-Lizenz.
Dieses Buch wurde in RStudio mit Hilfe von bookdown geschrieben.
Diese Version des Buches wurd mit der R-Version R version 4.2.0 (2022-04-22) und den folgenden Paketen erstellt:
package | version | source |
---|---|---|
bookdown | 0.26 | CRAN (R 4.2.0) |
broom | 0.8.0 | CRAN (R 4.2.0) |
corrr | NA | NA |
dials | 0.1.1 | CRAN (R 4.2.0) |
downlit | 0.4.0 | CRAN (R 4.2.0) |
dplyr | 1.0.9 | CRAN (R 4.2.0) |
ggplot2 | 3.3.6 | CRAN (R 4.2.0) |
glmnet | NA | NA |
infer | 1.0.2 | CRAN (R 4.2.0) |
ISLR | NA | NA |
kknn | 1.3.1 | CRAN (R 4.2.0) |
klaR | NA | NA |
MASS | 7.3-56 | CRAN (R 4.2.0) |
modeldata | 0.1.1 | CRAN (R 4.2.0) |
parsnip | 0.2.1 | CRAN (R 4.2.0) |
patchwork | 1.1.1 | CRAN (R 4.2.0) |
purrr | 0.3.4 | CRAN (R 4.2.0) |
randomForest | NA | NA |
ranger | 0.13.1 | CRAN (R 4.2.0) |
readr | 2.1.2 | CRAN (R 4.2.0) |
rsample | 0.1.1 | CRAN (R 4.2.0) |
rstatix | NA | NA |
tibble | 3.1.7 | CRAN (R 4.2.0) |
tidymodels | 0.2.0 | CRAN (R 4.2.0) |
tidyr | 1.2.0 | CRAN (R 4.2.0) |
tidyverse | 1.3.1 | CRAN (R 4.2.0) |
tune | 0.2.0 | CRAN (R 4.2.0) |
vip | 0.3.2 | CRAN (R 4.2.0) |
workflows | 0.2.6 | CRAN (R 4.2.0) |
workflowsets | 0.2.1 | CRAN (R 4.2.0) |
xgboost | 1.6.0.1 | CRAN (R 4.2.0) |
yardstick | 1.0.0 | CRAN (R 4.2.0) |