Diplom-Psychologe Achim Biesenbach: Testtheorie

Testtheorie

Die klassische Testtheorie geht davon aus, dass das Testergebnis eigentlich dem wahren Ausprägungsgrad des untersuchten Mm entspricht, dass aber jede Messung oder jedes Testergebnis zusätzlich von einem Messfehler überlagert ist. Der Testwert repräsentiert damit die "wahre" Merkmalsausprägung zuzüglich einer den Testwert vergrößernden oder verkleinernden Fehlerkomponente (z.B. aufgrund mangelnder Konzentration, Übermüdung...). Die wahre Merkmalsausprägung kann nur erschlossen werden, wenn der Testfehler bekannt ist. Dieses ist das Problem der klassischen Testtheorie.

Die klassische Testtheorie beschäftigt sich mit der Frage, wie aus einer Anzahl von Verhaltensbeobachtungen

xvi

von

Vpv

in bestimmten Situationen

auf die wahre Ausprägung

eines Persönlichkeitsmerkmals von

Vpv

geschlossen werden können.

Bei der probabilistischen Testtheorie basiert der Grundgedanke auf der Annahme, dass die Wahrscheinlichkeit einer bestimmten Antwort auf jedes einzelne Item von der Ausprägung einer latent vorhandenen Merkmalsdimension abhängt. Eine Person mit besserer mathematischer Denkfähigkeit löst eine mathematische Aufgabe mit höherer

Whk

als eine Person mit schlechterer mathematischer Denkfähigkeit.

Ein probabilistisches Testmodell ermittelt diejenigen Merkmalsausprägungen, die für verschiedene Arten der Itembeantwortungen am wahrscheinlichsten sind.

Das Rasch-Modell unterstellt, dass den beobachtbare (manifesten) Reaktionen, wie sie für alle Pers. auf bestimmte Items möglich sind, eine nicht beobachtbare, latente Eigenschaft zugrunde liegt. Letztere stehen mit ersteren in wahrscheinlichkeitsfunktionalem Zusammenhang.

Problem: lokale stochastische Unabhängigkeit: Ob eine Versuchsperson eine Aufgabe löst, hängt nur von ihrer Fähigkeit ab, nicht aber davon, welche anderen Aufgaben sie bereits gelöst hat oder noch lösen wird.

Problem, dass ein Item so sensibel misst wie der gesamte Test, die lokale stochastische Unabhängigkeit ist fraglich, weil das Lösen eines Items die Wahrscheinlichkeit, dass das andere Item gelöst wird, beeinflusst. Hier spielt auch wieder die Trennschärfe eine Rolle. Wenn alle Items gleich schwer sind und auch noch das Gleiche messen, dann kann die stochastische Unabhängigkeit nicht gegeben sein.

Die klassische Testtheorie ist deterministisch. Das Testergebnis entspricht, abgesehen von Messfehlern, direkt der Merkmalsausprägung.

Grundlegend für die klassische Testtheorie sind folgende Axiome:

Das Testergebnis setzt sich additiv aus dem "wahren Wert" und dem Messfehler zusammen.
Bei wiederholten Testanwendungen kommt es zu einem Fehlerausgleich, d.h. der Erwartungswert des Messfehlers ist Null.
Die Höhe des Messfehlers ist unabhängig vom Ausprägungsgrad des getesteten Mm.
Die Messfehler verschiedener Testanwendungen (bei verschiedenen Personen od. Testwiederholungen bei einer Person) sind voneinander unabhängig. (lokale stochastische Unabhängigkeit: Items sollen unabhängig von einander sein, Itembarbeitung durch Versuchsperson auch unabhängig)
```
rit = r (xvi , xv)
```
d.h. Item-Test-Korrelation, dieses wird als Trennschärfe des Items
```
i
```
bezeichnet. Eine hohe positive Trennschärfe sagt, dass die einzelnen Items Ähnliches wie der Gesamttest misst, hohe Trennschärfen werden erreicht, wenn Items weder zu leicht noch zu schwer sind, mit 0.5 Wahrscheinlichkeit. gelöst werden.

Gütekriterien in der Testtheorie

Hieraus ergeben sich die Gütekriterien

Hauptgütekriterien:

Objektivität
Reliabilität
Validität

Nebengütekriterien:

Normiertheit
Vergleichbarkeit
Nützlichkeit

Objektivität ist der Grad, in dem die Ergebnisse eines Tests unabhängig vom Untersucher sind, d.h. wenn verschiedene Testanwender bei denselben Personen zu den gleichen Resultaten gelangen.
1. Durchführungsobjektivität ist der Grad der Unabhängigkeit der Testergebnisse von zufälligen oder systematischen Verhaltensvariationen des Untersuchers während der Testdurchführung mit Rückwirkung auf den Pbn, schriftliche Instruktion, standardisierte Situation.
2. Auswertungsobjektivität betrifft die numerische oder kategoriale Auswertung des Testverhaltens nach vorgegebenen Regeln.
3. Interpretationsobjektivität ist der Grad der Unabhängigkeit der Interpretation des Testergebnisses von der Person des interpretierenden Psychologen.
Reliabilität ist der Grad der Genauigkeit, mit der ein Mm gemessen wird, gleichgültig, ob dieses Mm gemessen werden soll.
1. Paralleltest-Reliabilität: Eine Stichprobe von Pbn werden zwei einander streng vergleichbare Tests vorgelegt und deren Ergebnisse korreliert, weil die Reliabilität der Kovarianz beider Tests entspricht
2. Retestreliabilität: Einer Stichprobe von Pbn wird derselbe Test zweimal vorgelegt und die Ergebnisse korreliert.
3. Innere Konsistenz
  - Testhalbierungsreliabilität: Einer Stichprobe von Pbn wird der Test vorgelegt. Dann wird der Test in zwei gleichwertige Hälften zerlegt, und die Ergebnisse der beiden Hälften korreliert.
  - Konsistenzanalyse: Bei homogenen Items Zerlegung des Tests in seine Items. Bei verschiedenen Tests den alpha-Koeffizienten nicht vergessen, z.B. = 0.05,
Validität ist der Grad der Genauigkeit, mit dem der Test dasjenige Mm, das er messen soll, tatsächlich misst.
1. Inhaltliche Validität: Der Test stellt selbst das optimale Kriterium für das Mm dar. Dieses ergibt in der Regel ein Expertenrating.
2. Kriterienbezogene Validität: Außenkriterium, das in irgendeiner direkten oder indirekten Weise das zu erfassende Mm widerspiegelt.

zurück zum Anfang: "Psychologische Testverfahren"

Achim Biesenbach - Praxis für Psychotherapie - Hilden

Testtheorie

Gütekriterien in der Testtheorie