Kapitel 1 Einleitung

Figure 1.1: Lustige Tierchen, buntes Treiben: Willkommen beim Auswerten von Umfragedaten

Fragebogendaten zu psychologischen Variablen (wie z.B. Extraversion), die wissenschaftlichen Ansprüchen genügen, bezeichnet man als psychometrische Daten (vgl. Steyer and Eid 1993). Der Analyse psychometrischer Daten kommt große Bedeutung innerhalb der Psychologie (und angrenzender Gebiete wie Marketing) zu. Der Grund ist, dass Daten häufig in Form von Fragebogen, psychometrischer Fragebogen, erhoben werden. Besonders für Persönlichkeitskonstrukte und Einstellungen, kurz für Fragestellungen der Persönlichkeitspsychologie und, davon abgeleitet, der Diagnostik, erfreuen sie sich weiter Verbreitung.

Ziel dieses Beitrags ist es, eine praktische Anleitung für typische (und grundlegende) psychometrischen Analysen mittels R zu geben. Dabei soll demonstriert und erläutert werden, welche Analysen und wie durchgeführt werden in einer grundständigen psychometrischen Analyse. Es wird sowohl der Einzelfall-Diagnostik Rechnung getragen, als auch der Testvalidierung. Anders gesagt, dieses Dokument hilft, u.a. folgende Fragen zu beantworten: “Wie leistungsfähig war der Applikant im Vergleich zu seiner Referenzgruppe?”, “Wie ist die Qualität dieses Testverfahrens einzuschätzen?”.

Test wird hier verstanden sensu Lienert and Raatz (1998) (S. 14f):

ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage über den relativen Grad der individuellen Merkmalsausprägung.

Inhalte werden im Rahmen einer Fallstudie erarbeitet; d.h. es wird ein echter Datensatz analysiert, wobei einige Hintergründe zu den verwendeten Methoden erläutert werden.

1.1 Hilfe zu R

Eine praktische Einführung zu Datenanalyse bietet ModernDive (auf Englisch); eine umfassende Einführung in Englisch findet sich bei Sauer (2019).

1.2 Zu messendes Konstrukt: Extraversion

Satow (2012) definiert Extraversion wie folgt:

Extraversion (E) (Gegenteil: Introversion): Bereits C.G. Jung (1921) hatte beobachtet, dass Menschen entweder eher nach außen (gesellig, gesprächig, abenteuerlustig) oder nach innen orientiert (nachdenklich, in-sich-gekehrt) sind. Aufgrund dieser Beobachtungen hielt Eysenck (1947) Extraversion für einen der drei wesentlichen Persönlichkeitsdimensionen. Spätere Untersuchungen konnten zeigen, dass erfolgreiche Führungskräfte häufig eher extravertiert sind und dass Arbeitsleistung und Arbeitszufriedenheit generell mit Extraversion korrelieren (Judge et al., 2002; Lim & Ployhart, 2004) – wobei es jedoch auch Ausnahmen gibt. So sind überraschend viele erfolgreiche Unternehmensgründer und besonders innovative Persönlichkeiten wie Bill Gates, Warren Buffett oder Steven Spielberg häufig überraschend introvertiert (Jones, 2006).

1.3 Messinstrument

Es wird ein Datensatz zur Extraversion analysiert. Extraversion wurde operationalisiert mit dem Inventar B5T von Satow (Satow 2020). Das Instrument besteht aus 10 Items mit vier Likert-Antwortstufen (von “trifft gar nicht zu” bis “trifft voll und ganz zu”) und ist für Forschungszwecke kostenlos nutzbar¹:

der B5T ist als Paper-Pencil-Version, Excel-Version sowie als Online-Version verfügbar und kann für nichtkommerzielle Forschungs- und für Unterrichtszwecke kostenlos verwendet werden. Der B5T wurde offiziell in die PSYNDEX-Testdatenbank (Tests-Nr. 9006357) und in das elektronische Testarchiv des Leibniz-Zentrums für Psychologische Information und Dokumentation (ZPID) aufgenommen.

An anderer Stelle² ist zur Lizenz zu lesen:

Lizenz: Sie dürfen den Test ausschließlich zu Forschungs- und Unterrichtszwecken einsetzen und übersetzen. Sie müssen die Quelle nennen und ein elektronisches Belegexemplar oder die Quellenangabe (Autor, Titel, Zeitschrift/Buch, Erscheinungsjahr) Ihrer Veröffentlichung an mailATdrsatow.de senden.

Zur Reliabilität berichtet Satow (2012), dass Cronbachs Alpha bei .87 liege, was ein guter Wert ist. Machen wir diese Variable für R verfügbar:

extra_alpha <- .87

Der Test hat einige Validierungsstudien erfahren, allerdings ist die Qualität dieser Studien zum Teil fraglich, da es sich um “graue” Literatur handelt, also Literatur, die nicht öffentlich (einfach) zugänglich ist. Außerdem gibt es kaum Fachartikel, die ein Blind-Begutachtungsverfahren durchlaufen hätten; die meisten Studien zum B5T basieren auf Abschlussarbeiten; auch einige von FOM-Studierenden sind zu finden.

Die Items zum Test sind über die Webseite des Anbieters abrufbar³.

1.4 R-Pakete

Folgende R-Pakete werden für diesen Kurs benötigt. Bitte stellen Sie sicher, dass Sie diese Pakete vor Beginn der Analyse installiert haben. Sie installieren ein R-Paket mit dem Befehl install.packages(name_des_pakets).

library(mosaic)  # Statistik allgemein
library(tidyverse)  # Datenjudo
library(sjmisc)  # Deskriptive Statistik
# library(apa)  # Statistiken nach APA formatieren
library(mice)  # Hilfen für fehlende Werte
library(devtools)  # Pakete von Github installieren
library(ggstatsplot)  # Visualisierung
library(janitor)  # Daten aufräumen
library(ggpubr)  # Visualisierung
library(psych)  # psychometrische Analyse

1.5 Vertiefung: Infos zu Paketen

Sie fragen sich, was das Paket praise(), fortunues() oder R_for_superheros()⁴ für Sie bereithält? Mit folgender Funktion bekommen Sie die Hilfe-Seiten eines Pakets angezeigt.

help(package = "apa")

1.6 Daten

1.6.1 Daten - aus Paket `pradadata`

Die Daten können über mehrere Weg abgerufen werden. Eine Möglichkeit bietet das R-Paket pradadata⁵, da es auf Github⁶ zu finden ist, muss zuerst ein Paket verfügbar sein, dass R-Paket von dort aus installiert. Dazu verwenden wir das Paket devtools; wie jedes Paket muss es zuerst installiert sein:

install.packages("devtools")  # nur einmalig

Dann können wir das Paket installieren:

install_github("sebastiansauer/pradadata")

laden und daraus den Datensatz zur Extraversion:

library("pradadata")
data(extra)

Betrachten wir den Datensatz

inspect(extra)

1.6.2 Daten - via Webseite

Alternativ zur Installation via R-Paket pradadata stehen die Daten unter diesem Link zum Herunterladen bereit:

data_url <- "https://raw.githubusercontent.com/sebastiansauer/modar/master/datasets/extra.csv"
extra <- read_csv(data_url)

1.6.3 Umfrage zu den Daten

Die Daten wurden mit dieser Umfrage erhoben.

1.7 Technische Hinweise

Sessioninfo:

Datum: 2022-07-27
R-Version: R version 4.2.0 (2022-04-22)
Betriebssystem:

2 Daten aufräumen