Rasch-Modell

Das Rasch-Modell ist ein vom dänischen Statistiker Georg Rasch entwickeltes mathematisch-psychologisches Modell der probabilistischen Testtheorie (auch genannt Item-Response-Theorie).

Überblick

Psychologische Tests (Fragebögen, Leistungstests) zur Messung psychischer Merkmale können auf verschiedenen Messmodellen basieren. Letztere unterscheiden sich darin, wie aus den Antworten auf die Items eines Tests auf die Ausprägung der Fähigkeiten bzw. Eigenschaften einer Person (z. B. Intelligenz oder Extraversion) geschlossen wird – und wie die Tests daraufhin konstruiert sein müssen. Zwei Modellarten bzw. -klassen sind vor allem zu unterscheiden, die Klassische Testtheorie (KTT) und die Probabilistische Testtheorie, die bestimmte Nachteile der klassischen Testtheorie überwinden will. Zu letzterer gehört auch das Rasch-Modell. Der Vorteil probabilistischer Modelle liegt darin, dass aus dem beobachteten Antwortverhalten auf zwei latente Variablen geschlossen wird, welche das Antwortverhalten determinieren: die Itemschwierigkeit und die Fähigkeit der Person. Ein Effekt ist, dass die Schätzung der Fähigkeit dann unabhängig von der Itemschwierigkeit erfolgen kann. Ein ähnliches Modell fand z. B. auch innerhalb der PISA-Studie Anwendung.

Wissenschaftlicher Hintergrund

Itemfunktion des Rasch-Modells

Das Rasch-Modell postuliert im Vergleich zum Guttman-Modell keinen deterministischen Zusammenhang zwischen dem Testverhalten einer Versuchsperson und deren Personenparameter. Vielmehr wird ein zugrundeliegendes Persönlichkeitsmerkmal („Latent Trait“ als latente Variable) angenommen, von dessen Ausprägung das manifeste Lösungsverhalten in probabilistischer Weise abhängt.

Die Wahrscheinlichkeit der Antwort von Person v bei Aufgabe i ist bestimmt durch die Modellgleichung:

Die Likelihood-Funktion ist:

wobei Xvi eine Zufallsvariable ist, welche den Wert 1 annimmt, wenn die Person v die Aufgabe i löst, und die den Wert 0 annimmt, wenn die Person v die Aufgabe nicht löst. θv ist die latente Fähigkeit der Person v, σi ist die Schwierigkeit der Aufgabe i, bezeichnet die natürliche Exponentialfunktion. Formal liegt hier ein Logit-Modell vor, das die Anteile von 0 bzw. 1 in eine stetige Verteilung überführt.

Parameterschätzung

Konfidenzintervalle für die geschätzten Personenparameter θv

Die Parameterschätzung erfolgt im Rasch-Modell über einen Maximum-Likelihood-Ansatz. Es gibt 3 Methoden zur Schätzung der Personen- und Aufgabenparameter:

  • Es kann eine gemeinsame Schätzung der Personen- und Aufgabenparameter erfolgen, dabei leidet allerdings die Konsistenz der Statistik.[1]
  • Eine andere Methode ist die bedingte Maximum-Likelihood-Schätzung (auch Conditional Maximum-Likelihood-Methode).[1] Hierbei werden zunächst die Aufgabenparameter unter der bedingten Likelihood der Daten gegeben, die suffiziente Summenstatistik für den Personenparameter geschätzt und nachfolgend die unbedingten Maximum-Likelihood-Schätzer der Personenparameter.
  • Die dritte Methode ist die marginale Maximum-Likelihood-Schätzung, bei der Annahmen über die Verteilung der Personenparameter in der Population getroffen werden.

Im Vergleich zur klassischen Testtheorie kann im Rasch-Modell für jeden geschätzten Personenparameter θv ein individuelles Konfidenzintervall angegeben werden. Dieses wird eng, wenn für die jeweilige Personenfähigkeit θv mehrere Items Informationen liefern (Maximale Information gdw. θv = σi). Es wird breit bei wenig Items, die für diesen Bereich Informationen liefern (i. d. R. ist dies bei extremen Ausprägungen der Fall).

Nutzen

Im Rasch-Modell erfolgt eine Trennung des Einflusses der Personenfähigkeit θv vom Einfluss der Testaufgabe σi. Damit wird eine Messung gemäß der Messtheorie etabliert. Vergleiche von Personen (bzw. Aufgaben), die von den Aufgaben (bzw. Personen) unabhängig sind, werden möglich. Diese Eigenschaft wird von Rasch als „spezifische Objektivität“ bezeichnet. Weiterhin bildet das Rasch-Modell die Grundlage für adaptives Testen, da der Personenparameter nach jeder Aufgabe neu berechnet werden kann und dadurch entsprechend Items selektiert werden können, die maximale Information liefern. Ebenfalls etabliert wird eine Basis für Veränderungsmessungen. Die klassische Testtheorie setzt dagegen stabile Persönlichkeitsmerkmale voraus und ist aus psychometrischer Sicht dafür nicht konzipiert.

Modelltest

Modelltest und Aufgabenselektion

Innerhalb des Rasch-Modells kann ein Modelltest durch die Schätzung der Aufgabenparameter σi in Teilstichproben erfolgen. Dies ist möglich, da die Schätzungen unabhängig von den eingehenden Personenparametern sind (siehe spezifische Objektivität). Hierzu kann man eine Stichprobe z. B. am Median splitten. Trägt man die erhaltenen Schätzwerte gegeneinander ab, so sollten sie auf einer Geraden durch den Nullpunkt mit Steigung 1 liegen. Die Abweichung von dieser Geraden kann im Rahmen der Testkonstruktion als Kriterium zur Aufgabenselektion genutzt werden (siehe Abbildung). Die Vorhersagen können auch durch einen Likelihood-Quotienten-Test[2] statistisch geprüft werden. Bei optimaler Modellpassung nimmt dieser Quotient einen Wert von 1 an.

Literatur

  • G. H. Fischer, I. W.Molenaar: Rasch Models. Foundations, Recent Developments, and Applications. Springer, New York 1995, ISBN 0-387-94499-0.
  • E. B. Andersen: A goodness of fit test for the Rasch model. In: Psychometrika. Band 38, 1973, S. 123–140. doi:10.1007/BF02291180
  • S. Embretson, S. Reise: Item response theory for psychologists. Erlbaum, Mahwah NJ 2000, ISBN 0-585-34782-4.
  • F. Gernot: Probabilistische Testmodelle in der Persönlichkeitsdiagnostik. Lang, Frankfurt am Main 1993, ISBN 3-631-46030-9.
  • H. Irtel: Entscheidungs- und testtheoretische Grundlagen der Psychologischen Diagnostik. Lang, Frankfurt am Main 1996, ISBN 3-631-49374-6.
  • W. Kempf: Dynamische Modelle zur Messung sozialer Verhaltenspositionen [Dynamic models for measuring social relationships]. In: W. Kempf (Hrsg.): Probabilistische Modelle in der Sozialpsychologie [Probabilistic models in social psychology]. Huber, Bern 1974, S. 13–55.
  • W. Kempf: A dynamic test model and its use in the micro-evaluation of instrumental material. In: H. Spada, W. Kempf (Hrsg.): Structural models for thinking and learning. Huber, Bern 1977, S. 295–318.
  • W. Kempf: Dynamic models for the measurement of „traits“ in social behavior. In: W. Kempf, B. H. Repp (Hrsg.): Mathematical models for social psychology. Wiley, New York 1977, S. 14–58.
  • W. Kempf, R. Langeheine: Item-Response-Modelle in der sozialwissenschaftlichen Forschung. regener, Berlin 2012, ISBN 978-3-936014-29-7.
  • H. Müller: Summenscore und Trennschärfe beim Rasch-Modell. In: Psychologische Rundschau. Band 51, 2000, S. 34–35. doi:10.1026//0033-3042.51.1.34
  • Matthias von Davier, Claus H. Carstensen (Hrsg.): Multivariate and Mixture Distribution Rasch Models. Extensions and Applications. Springer, Berlin 2006, ISBN 0-387-32916-1.
  • G. Rasch: Probabilistic models for some intelligence and attainment tests. Danish Institute for Educational Research, Copenhagen 1960. (The University of Chicago Press, Chicago 1980, ISBN 0-226-70553-6)
  • J. Rost: Was ist aus dem Rasch-Modell geworden? In: Psychologische Rundschau. Band 50, 1999, S. 140–156. doi:10.1026//0033-3042.50.3.140
  • J. Rost: Testtheorie – Testkonstruktion. Huber, Göttingen 2003, ISBN 3-456-83964-2.

Einzelnachweise

  1. a b M. Amelang, L. Schmidt-Atzert: Psychologische Diagnostik und Intervention. Springer, Heidelberg 2006, S. 75.
  2. Andersen, 1973

Etliche Software-Pakete sind auf dem Markt. Einige ausführbare Programme sind frei erhältlich, zum Teil allerdings nur als Demo-Version mit reduziertem Leistungsumfang. Auch Open-Source-Software ist verfügbar.