Testtheorie
Die klassische Testtheorie geht
davon aus, dass
das Testergebnis eigentlich dem wahren
Ausprägungsgrad des untersuchten Mm entspricht, dass aber jede
Messung oder jedes Testergebnis
zusätzlich von einem Messfehler überlagert ist. Der Testwert
repräsentiert damit die "wahre" Merkmalsausprägung
zuzüglich einer den Testwert
vergrößernden oder verkleinernden Fehlerkomponente
(z.B. aufgrund mangelnder Konzentration,
Übermüdung...). Die wahre Merkmalsausprägung
kann nur erschlossen werden, wenn der Testfehler
bekannt ist. Dieses ist das Problem der klassischen
Testtheorie.
Die klassische Testtheorie
beschäftigt
sich mit der Frage, wie aus einer Anzahl von Verhaltensbeobachtungen
xvi
von
Vpv
in bestimmten Situationen
i
auf die wahre Ausprägung
v
eines Persönlichkeitsmerkmals von
Vpv
geschlossen werden können.
Bei der probabilistischen Testtheorie
basiert der Grundgedanke auf der Annahme, dass die Wahrscheinlichkeit
einer bestimmten Antwort auf jedes einzelne Item von der
Ausprägung einer latent vorhandenen Merkmalsdimension
abhängt. Eine Person mit besserer mathematischer
Denkfähigkeit löst eine mathematische Aufgabe mit
höherer
Whk
als eine Person mit schlechterer mathematischer Denkfähigkeit.
Ein probabilistisches Testmodell
ermittelt diejenigen Merkmalsausprägungen, die für
verschiedene Arten der Itembeantwortungen am wahrscheinlichsten sind.
Das Rasch-Modell unterstellt, dass
den
beobachtbare (manifesten) Reaktionen, wie sie für alle Pers.
auf bestimmte Items möglich sind, eine nicht beobachtbare,
latente Eigenschaft zugrunde liegt. Letztere stehen mit ersteren in
wahrscheinlichkeitsfunktionalem Zusammenhang.
Problem: lokale stochastische
Unabhängigkeit:
Ob eine Versuchsperson eine Aufgabe löst, hängt nur
von ihrer Fähigkeit ab, nicht aber davon, welche anderen
Aufgaben sie bereits gelöst hat oder noch lösen wird.
Problem, dass ein Item so sensibel misst wie der gesamte Test,
die lokale stochastische Unabhängigkeit ist fraglich, weil das
Lösen eines Items die Wahrscheinlichkeit, dass das andere Item
gelöst wird, beeinflusst. Hier spielt auch wieder die
Trennschärfe eine Rolle. Wenn alle Items gleich schwer sind
und auch noch das Gleiche messen, dann kann die stochastische
Unabhängigkeit nicht gegeben sein.
Die klassische Testtheorie ist
deterministisch.
Das Testergebnis entspricht, abgesehen von
Messfehlern, direkt der Merkmalsausprägung.
Grundlegend für die klassische
Testtheorie
sind folgende Axiome:
- Das Testergebnis setzt sich
additiv aus dem
"wahren Wert" und dem Messfehler zusammen.
- Bei wiederholten Testanwendungen
kommt es zu
einem Fehlerausgleich, d.h. der Erwartungswert des Messfehlers ist
Null.
- Die Höhe des Messfehlers ist
unabhängig vom
Ausprägungsgrad des getesteten Mm.
- Die Messfehler verschiedener Testanwendungen
(bei
verschiedenen Personen od. Testwiederholungen bei einer Person) sind
voneinander unabhängig. (lokale stochastische
Unabhängigkeit: Items sollen unabhängig von einander
sein, Itembarbeitung durch Versuchsperson auch unabhängig)
-
rit = r (xvi , xv)
d.h. Item-Test-Korrelation, dieses wird als
Trennschärfe des Items
i
bezeichnet. Eine hohe positive Trennschärfe sagt, dass die
einzelnen Items Ähnliches wie der Gesamttest
misst, hohe Trennschärfen werden erreicht, wenn Items weder zu
leicht noch zu schwer sind, mit 0.5 Wahrscheinlichkeit. gelöst
werden.
Gütekriterien in der Testtheorie
Hieraus ergeben sich die Gütekriterien
Hauptgütekriterien:
- Objektivität
- Reliabilität
- Validität
Nebengütekriterien:
- Normiertheit
- Vergleichbarkeit
- Nützlichkeit
- Objektivität ist der Grad, in dem die
Ergebnisse eines Tests
unabhängig vom Untersucher sind, d.h. wenn verschiedene
Testanwender bei denselben Personen zu den gleichen Resultaten
gelangen.
- Durchführungsobjektivität ist
der Grad der Unabhängigkeit der Testergebnisse von
zufälligen oder systematischen Verhaltensvariationen des
Untersuchers während der Testdurchführung mit
Rückwirkung auf den Pbn, schriftliche Instruktion,
standardisierte Situation.
- Auswertungsobjektivität betrifft die
numerische oder kategoriale Auswertung des Testverhaltens nach
vorgegebenen Regeln.
- Interpretationsobjektivität ist der Grad
der Unabhängigkeit der Interpretation des Testergebnisses von
der Person des interpretierenden Psychologen.
- Reliabilität ist der
Grad der
Genauigkeit, mit der ein Mm gemessen wird, gleichgültig, ob
dieses Mm gemessen werden soll.
- Paralleltest-Reliabilität: Eine
Stichprobe von Pbn werden zwei einander streng vergleichbare Tests
vorgelegt und deren Ergebnisse korreliert, weil die
Reliabilität der Kovarianz beider Tests entspricht
- Retestreliabilität: Einer Stichprobe von
Pbn wird derselbe Test zweimal vorgelegt und die Ergebnisse korreliert.
- Innere Konsistenz
- Testhalbierungsreliabilität: Einer
Stichprobe von Pbn wird der Test vorgelegt. Dann wird der Test in zwei
gleichwertige Hälften zerlegt, und die Ergebnisse der beiden
Hälften korreliert.
- Konsistenzanalyse: Bei homogenen Items
Zerlegung des Tests in seine Items. Bei verschiedenen Tests den
alpha-Koeffizienten nicht vergessen, z.B. = 0.05,
- Validität ist der Grad der Genauigkeit, mit
dem der Test
dasjenige Mm, das er messen soll, tatsächlich misst.
- Inhaltliche Validität: Der Test stellt
selbst das optimale Kriterium für das Mm dar. Dieses ergibt in
der Regel ein Expertenrating.
- Kriterienbezogene Validität:
Außenkriterium, das in irgendeiner direkten oder indirekten
Weise das zu erfassende Mm widerspiegelt.
zurück
zum Anfang:
"Psychologische Testverfahren"
|