Rasch-ModellDas Rasch-Modell ist ein vom dänischen Statistiker Georg Rasch entwickeltes mathematisch-psychologisches Modell der probabilistischen Testtheorie (auch genannt Item-Response-Theorie). ÜberblickPsychologische Tests (Fragebögen, Leistungstests) zur Messung psychischer Merkmale können auf verschiedenen Messmodellen basieren. Letztere unterscheiden sich darin, wie aus den Antworten auf die Items eines Tests auf die Ausprägung der Fähigkeiten bzw. Eigenschaften einer Person (z. B. Intelligenz oder Extraversion) geschlossen wird – und wie die Tests daraufhin konstruiert sein müssen. Zwei Modellarten bzw. -klassen sind vor allem zu unterscheiden, die Klassische Testtheorie (KTT) und die Probabilistische Testtheorie, die bestimmte Nachteile der klassischen Testtheorie überwinden will. Zu letzterer gehört auch das Rasch-Modell. Der Vorteil probabilistischer Modelle liegt darin, dass aus dem beobachteten Antwortverhalten auf zwei latente Variablen geschlossen wird, welche das Antwortverhalten determinieren: die Itemschwierigkeit und die Fähigkeit der Person. Ein Effekt ist, dass die Schätzung der Fähigkeit dann unabhängig von der Itemschwierigkeit erfolgen kann. Ein ähnliches Modell fand z. B. auch innerhalb der PISA-Studie Anwendung. Wissenschaftlicher HintergrundDas Rasch-Modell postuliert im Vergleich zum Guttman-Modell keinen deterministischen Zusammenhang zwischen dem Testverhalten einer Versuchsperson und deren Personenparameter. Vielmehr wird ein zugrundeliegendes Persönlichkeitsmerkmal („Latent Trait“ als latente Variable) angenommen, von dessen Ausprägung das manifeste Lösungsverhalten in probabilistischer Weise abhängt. Die Wahrscheinlichkeit der Antwort von Person v bei Aufgabe i ist bestimmt durch die Modellgleichung: Die Likelihood-Funktion ist: wobei Xvi eine Zufallsvariable ist, welche den Wert 1 annimmt, wenn die Person v die Aufgabe i löst, und die den Wert 0 annimmt, wenn die Person v die Aufgabe nicht löst. θv ist die latente Fähigkeit der Person v, σi ist die Schwierigkeit der Aufgabe i, bezeichnet die natürliche Exponentialfunktion. Formal liegt hier ein Logit-Modell vor, das die Anteile von 0 bzw. 1 in eine stetige Verteilung überführt. ParameterschätzungDie Parameterschätzung erfolgt im Rasch-Modell über einen Maximum-Likelihood-Ansatz. Es gibt 3 Methoden zur Schätzung der Personen- und Aufgabenparameter:
Im Vergleich zur klassischen Testtheorie kann im Rasch-Modell für jeden geschätzten Personenparameter θv ein individuelles Konfidenzintervall angegeben werden. Dieses wird eng, wenn für die jeweilige Personenfähigkeit θv mehrere Items Informationen liefern (Maximale Information gdw. θv = σi). Es wird breit bei wenig Items, die für diesen Bereich Informationen liefern (i. d. R. ist dies bei extremen Ausprägungen der Fall). NutzenIm Rasch-Modell erfolgt eine Trennung des Einflusses der Personenfähigkeit θv vom Einfluss der Testaufgabe σi. Damit wird eine Messung gemäß der Messtheorie etabliert. Vergleiche von Personen (bzw. Aufgaben), die von den Aufgaben (bzw. Personen) unabhängig sind, werden möglich. Diese Eigenschaft wird von Rasch als „spezifische Objektivität“ bezeichnet. Weiterhin bildet das Rasch-Modell die Grundlage für adaptives Testen, da der Personenparameter nach jeder Aufgabe neu berechnet werden kann und dadurch entsprechend Items selektiert werden können, die maximale Information liefern. Ebenfalls etabliert wird eine Basis für Veränderungsmessungen. Die klassische Testtheorie setzt dagegen stabile Persönlichkeitsmerkmale voraus und ist aus psychometrischer Sicht dafür nicht konzipiert. ModelltestInnerhalb des Rasch-Modells kann ein Modelltest durch die Schätzung der Aufgabenparameter σi in Teilstichproben erfolgen. Dies ist möglich, da die Schätzungen unabhängig von den eingehenden Personenparametern sind (siehe spezifische Objektivität). Hierzu kann man eine Stichprobe z. B. am Median splitten. Trägt man die erhaltenen Schätzwerte gegeneinander ab, so sollten sie auf einer Geraden durch den Nullpunkt mit Steigung 1 liegen. Die Abweichung von dieser Geraden kann im Rahmen der Testkonstruktion als Kriterium zur Aufgabenselektion genutzt werden (siehe Abbildung). Die Vorhersagen können auch durch einen Likelihood-Quotienten-Test[2] statistisch geprüft werden. Bei optimaler Modellpassung nimmt dieser Quotient einen Wert von 1 an. Literatur
Einzelnachweise
WeblinksWikibooks: Rasch-Analyse mit der freien Statistiksoftware R – Lern- und Lehrmaterialien
Etliche Software-Pakete sind auf dem Markt. Einige ausführbare Programme sind frei erhältlich, zum Teil allerdings nur als Demo-Version mit reduziertem Leistungsumfang. Auch Open-Source-Software ist verfügbar. |