Kapitel 13 Der rote Faden
Mittlerweile haben wir einiges zum Thema Data Science bzw. maschinelles Lernen behandelt (und sie hoffentlich viel gelernt).
Da ist es an der Zeit, einen Schritt zurück zu treten, um sich einen Überblick über den gegangenen Weg zu verschaffen, den berühmten “roten Faden” zu sehen, den zurückgelegten Weg nachzuzeichnen in den groben Linien, um einen (klareren) Überblick über das Terrain zu bekommen.
In diesem Kapitel werden wir verschiedene “Aussichtspfade” suchen, um im Bild zu bleiben, die uns einen Überblick über das Gelände versprechen.
13.0.1 Lernziele
- Sie erarbeiten sich einen Überblick über den bisher gelernten Stoff bzw. verfeinern Ihren bestehenden Überblick
13.1 Aussichtspunkt 1: Blick vom hohen Berg
Und so zeigt sich ein “Flussbild”9 (Abb. 13.1).
Der Reiseführer erzählt uns zu diesem Bild folgende Geschichte:
13.2 Aussichtspunkt 2: Blick in den Hof der Handwerker
Wenn man auf einem hohen Berg gestanden ist, hat man zwar einen guten Überblick über das Land bekommen, aber das konkrete Tun bleibt auf solchen Höhen verborgen.
Möchte man wissen, wie das geschäftige Leben abläuft, muss man also den tätigen Menschen über die Schulter schauen. Werfen wir also einen Blick in den “Hof der Handwerker”, wo grundlegende Werkstücke gefertigt werden, und wir jeden Handgriff aus der Nähe mitverfolgen können.
13.2.1 Ein maximale einfaches Werkstück mit Tidymodels
Weniger blumig ausgedrückt: Schauen wir uns ein maximal einfaches Beispiel an, wie man mit Tidymodels Vorhersagen tätigt. Genauer gesagt bearbeiten wir einen sehr einfachen Ansatz für einen Kaggle-Prognosewettbewerb.
13.3 Aussichtspunkt 3: Der Nebelberg (Quiz)
Da der “Nebelberg” zumeist in Wolken verhüllt ist, muss man, wenn man ihn ersteigt und ins Land hinunterschaut, erraten, welche Teile zu sehen sind. Sozusagen eine Art Landschafts-Quiz.
Voilà, hier ist es, das Quiz zum maschinellen Lernen:
13.4 Aussichtspunkt 4: Der Exerzitien-Park
Wir stehen vor dem Eingang zu einem Park, in dem sich viele Menschen an merkwürdigen Übungen, Exerzitien, befleißigen. Vielleicht wollen Sie sich auch an einigen Übungen abhärten? Bitte schön, lassen Sie sich nicht von mir aufhalten.
YACSDA: Yet Another Case Study on Data Analysis
…
NUR EXPLORATIVE DATENANALYSE
NUR LINEARE MODELL
Beispiel für Prognosemodellierung 1, grundlegender Anspruch, Video
Beispiel für Ihre Prognosemodellierung 2, mittlerer Anspruch
Fallstudie Einfache lineare Regression in Base-R, Anfängerniveau, Kaggle-Competition TMDB
YouTube-PLAYLISTS
MASCHINELLES LERNEN MIT TIDYMODELS
Experimenting with machine learning in R with tidymodels and the Kaggle titanic dataset
Sehr einfache Fallstudie zur Modellierung einer Regression mit tidymodels
Fallstudie zur Modellierung einer logististischen Regression mit tidymodels
Fallstudie Einfache lineare Regression mit Tidymodels, Kaggle-Competition TMDB
Fallstudie Einfaches Random-Forest-Modell mit Tidymodels, Kaggle-Competition TMDB
Fallstudie Workflow-Set mit Tidymodels, Kaggle-Competition TMDB
13.5 Aussichtspunkt 5: In der Bibliothek
Einen Überblick über eine Landschaft gewinnt man nicht nur von ausgesetzten Wegpunkten aus, sondern auch, manchmal, aus Schriftstücken. Hier ist eine Auswahl an Literatur, die Grundlagen zu unserem Landstrich erläutert.
Etwas weiter leiten uns diese Erzähler:
13.6 Krafttraining
Um die Aussicht genießen zu können, muss man manchmal ausgesetzte Plätze
in schwindelerregenden einigermaßen steilen als Hügel erkennbaren Höhen erreichen…
Sportliche Leistungen erreicht nur, wer trainiert ist. Das ist im Land des Data Science nicht anders.
Hier ist eine Liste von Übungen, die Ihre Datenkraft stählen soll:
- Lerngruppe: Den Wert einer Lerngruppe kann man kaum unterschätzen. Die Motivation, der Austausch, der Zwang seine Gedanken geordnet darzustellen, das wechselseitige Abfragen - diese Dinge machen eine Lerngruppe zu einem der wichtigsten Erfolgsgarant in Ihren Lernbemühungen.
- Exzerpte: Exzerpte, Zusammenfassungen also, sind nötig, um von einer vermeintlichen “Jaja, easy, versthe ich alles” Oberflächen-Verarbeitung zu einem (ausgeprägterem) Tiefenverständnis vorzudringen.
- Aufgaben: Manchmal stellt ein Dozent Aufgaben ein. Die Chance sollte man nutzen, denn zwar ist vieles in der Didaktikforschung noch unsicher, aber dass Aufgaben lösen beim Lernen hilft, und zwar viel, ist eines der wenigen unstrittigen Erkenntnisse.
- Fallstudien: Ähnliches wie Aufgaben, die oft kleinteilig-akademisch angelegt sind, hilft die große Schwester der schnöden Aufgabe, die Fallstudie, beim Vordringen in Verständnistiefen.
- Lesen: Ja, Lesen ist voll Old School. Aber so was Ähnliches wie Updaten der Brain-Software. Nützlich, weil die alte Software irgendwann nicht mehr supported wird.
- Forum: Sie haben eine Frage, aber Sie können unmöglich ein paar Tage warten, bis Sie den Dozenten im Unterricht sprechen? Posten Sie die Frage in einem Forum! Vielleicht im Forum des Moduls oder aber in einem geeigneten Forum im Internet.
- Youtube: Zwar wettern Dozentis gerne über die mangelnde Verarbeitungstiefe beim Fern schauen. Außerdem sind Lehrvideos didaktisch echt asbachuralt. Aber okay, manchmal und in überschaubarer Dosis ist ein Lehrvideo eine nützliche Ergänzung zu den übrigen Maßnahmen.
13.7 Aufgaben
- Einfache Random-Forest-Modellierung bei Kaggle (TMDB)
- Einfache Workflow-Set-Modellierung bei Kaggle (TMDB)
- Bearbeiten Sie so viele Fallstudien der Fallstudiensammlung wie nötig, um den Stoff flüssig zu beherrschen