de Rasch-Modell

Das Rasch-Modell ist ein vom dänischen Statistiker Georg Rasch entwickeltes mathematisch-psychologisches Modell der Item-Response-Theorie.

Überblick

Psychologisch-diagnostische Verfahren (insbesondere Leistungstests, aber z. B. auch Fragebögen) zur Messung psychischer Merkmale (insbesondere Fähigkeiten, aber z. B. auch Persönlichkeitseigenschaften) können auf verschiedenen Ansätzen der „Theorie des Messens“ basieren. Letztere unterscheiden sich darin, wie genau aus den jeweiligen Antworten auf die sog. Items (Fragen, insbesondere Aufgaben) eines solchen Verfahrens Rückschlüsse auf den Ausprägungsgrad der fraglichen Eigenschaft einer Person geschlossen wird). Dabei ist zu unterscheiden zwischen dem Ansatz der sog. [[Klassische Testtheorie<|Klassischen Testtheorie]] und der Item-Response-Theorie (manchmal noch immer bezeichnet als „Probabilistische Testtheorie“, weil der angesprochene Zusammenhang von Antwort und Eigenschaft nicht deterministisch, sondern probabilistisch/wahrscheinlichkeitsbasiert angenommen wird).

Ein ähnliches Modell fand z. B. auch innerhalb der PISA-Studie Anwendung.

Wissenschaftstheoretischer Hintergrund

So postuliert das Rasch-Modell folgende Wahrscheinlichkeit dafür, dass eine Person $v$ bei Aufgabe i zur Lösung (Antwort „1“) gelangt:

p(x_{vi}=1)={\frac {\exp(\xi _{v}-\sigma _{i})}{1+\exp(\xi _{v}-\sigma _{i})}}

- diese hängt also, abgesehen vom Zufall, vom Fähigkeitsparameter $\xi _{v}$ ab, das ist das (wahre) Fähigkeitsausmaß von Person $v$ , sowie vom Item- bzw. Schwierigkeitsparameter $\sigma _{i}$ , das ist der (wahre) Schwierigkeitsgrad von Aufgabe $i$ - und dies in Form einer logistischen Funktion. Die Wahrscheinlichkeit, dass diese Person $v$ die Aufgabe $i$ nicht löst (Antwort „0“), beläuft sich folglich auf:

$p(x_{vi}=0)=1-{\frac {\exp(\xi _{v}-\sigma _{i})}{1+\exp(\xi _{v}-\sigma _{i})}}={\frac {1}{1+\exp(\xi _{v}-\sigma _{i})}}$ .

Parameterschätzung

Konfidenzintervalle für die geschätzten Personenparameter ξθ_v

Die Parameterschätzung erfolgt im Rasch-Modell über den Maximum-Likelihood-Ansatz. Es gibt verschiedene Methoden der Parameterschätzung^[1]^[2]:

Die wissenschaftstheoretisch vorzuziehende Methode ist die einer bedingten Maximum-Likelihood-Schätzung der Item- bzw. Schwierigkeitsparameter (conditional Maximum-Likelihood-Methode)^[3], weil diese einen Modelltest ermöglicht und nicht bloß die Feststellung der Güte der Passung von Daten an das Modell mittels sog. goodness-of-fit Indizes. „Conditional“ bedeutet dabei eine Schätzung derart, dass die Bedingung gesetzt wird, die ebenfalls unbekannten Personen- bzw. Fähigkeitsparameter durch die diesen zugrunde liegenden erschöpfenden Statistik (hier: Anzahl der gelösten Aufgaben) ersetzen zu können.
Eine andere Methode ist die einer marginal Maximum-Likelihood-Schätzung der Itemparameter, bei der Annahmen über die Verteilung der Personenparameter in der Population getroffen werden.
Eine heutzutage kaum mehr angewendete Methode ist die der gemeinsamen Schätzung (joint Maximum-Likelihood-Schätzung) von Personen- und Itemparametern.

Bedeutung

Die besondere Bedeutung des Rasch-Modells ist darin begründet, dass es dann, wenn als Testwert in einem psychologischen Test die Anzahl gelöster Aufgaben verwendet wird, notwendigerweise gelten muss (sog. Notwendigkeitsbeweis^[4]). Begleitet wird dieser Umstand davon, dass seine Geltung für sämtliche Aufgaben eines psychologischen Tests eben empirisch/inferenzstatistisch mittels Modelltests geprüft werden kann. Letzteres steht im Zusammenhang damit, dass das Rasch-Modell „spezifisch objektive Vergleiche“ ermöglicht, d. h. insbesondere, dass in den Vergleich (der Schwierigkeit) von Aufgaben eines psychologischen Tests anhand beliebiger Personen nur die diesbezüglich relevanten („informativen“) Daten eingehen, aber nicht auch solche, die für den angestrebten Vergleich keine Information liefern^[5] - man spricht salopp auch von der sog. Stichprobenunabhängigkeit des Rasch-Modells^[6]. Als Konsequenz folgt daraus, dass dann, wenn sich die Schätzungen der Itemparameter für verschiedene Persongruppen als (statistisch) nicht gleich herausstellen, das Rasch-Modell nicht gilt.

Im Vergleich zur klassischen Testtheorie kann im Rasch-Modell für jeden geschätzten Personenparameter θ_v ein individuelles Konfidenzintervall angegeben werden. Dieses wird eng, wenn für die jeweilige Personenfähigkeit θ_v mehrere Items Informationen liefern (Maximale Information gdw. θ_v = σ_i). Es wird breit bei wenig Items, die für diesen Bereich Informationen liefern (i. d. R. ist dies bei extremen Ausprägungen der Fall).

Modelltest

Abbildung: Grafische Modellkontrolle nach *Rasch* als Indiz der Modellabweichung und Grundlage einer allfälligen Aufgabenselektion

In der Praxis wird am häufigsten eine Teilung der verfügbaren Personen-Stichprobe in Viel- und in Weniglöser vorgenommen (d. h. anhand des Medians des Testwerts in der verfügbaren Stichprobe). Eine grafische Modellkontrolle, die bereits von Georg Rasch selbst vorgeschlagen wurde, ergibt sich, indem die erhaltenen Schätzwerte aller Itemparameter in (den) zwei Teilstichproben in einem rechtwinkligen Koordinatensystem gegeneinander aufgetragen werden (für die eine Stichprobe auf der Abszisse, für die andere auf der Ordinate), Im Fall, dass die Itemparameterschätzungen innerhalb beider Stichproben jeweils auf eine Summe von null normiert wurden, sollten alle resultierenden Punkte auf einer Geraden mit Anstieg 1 liegen, wobei diese Gerade durch den Nullpunkt geht: Dann stimmen die Itemparameterschätzungen in allen Aufgaben überein. Drastische Abweichung von dieser Geraden können im Rahmen einer Testkonstruktion zur Aufgabenselektion genutzt werden (s. Abb.). Inferenzstatistisch wird vor allem der Likelihood-Quotienten-Test von Andersen^[7] eingesetzt; es existieren aber auch andere Modelltests^[8]^[9]^[10].

Literatur

G. H. Fischer: Einführung in die Theorie psychologischer Tests. Huber, Bern 1974.
G. H. Fischer, I. W.Molenaar: Rasch Models. Foundations, Recent Developments, and Applications. Springer, New York 1995, ISBN 0-387-94499-0.
E. B. Andersen: A goodness of fit test for the Rasch model. In: Psychometrika. Band 38, 1973, S. 123–140. doi:10.1007/BF02291180
S. Embretson, S. Reise: Item response theory for psychologists. Erlbaum, Mahwah NJ 2000, ISBN 0-585-34782-4.
K. D. Kubinger (Hrsg.): Moderne Testtheorie - Ein Abriß samt neuesten Beiträgen. Psychologie Verlags Union, München 1989, ISBN 3-407-86160-5. ISBN 3-407-86160-5.
K. D. Kubinger: Psychological Test Calibration using the Rasch Model - Some Critical Suggestions on Traditional Approaches. International Journal of Testing, 5, 2005, 377–394.
I. Koller, R. Alexandrowicz & R. Hatzinger: Das Rasch-Modell in der Praxis – Eine Einführung in eRm. facultas (UTB), Wien 2012.
F. Gernot: Probabilistische Testmodelle in der Persönlichkeitsdiagnostik. Lang, Frankfurt am Main 1993, ISBN 3-631-46030-9.
H. Irtel: Entscheidungs- und testtheoretische Grundlagen der Psychologischen Diagnostik. Lang, Frankfurt am Main 1996, ISBN 3-631-49374-6.
W. Kempf: Dynamische Modelle zur Messung sozialer Verhaltenspositionen [Dynamic models for measuring social relationships]. In: W. Kempf (Hrsg.): Probabilistische Modelle in der Sozialpsychologie [Probabilistic models in social psychology]. Huber, Bern 1974, S. 13–55.
W. Kempf: A dynamic test model and its use in the micro-evaluation of instrumental material. In: H. Spada, W. Kempf (Hrsg.): Structural models for thinking and learning. Huber, Bern 1977, S. 295–318.
W. Kempf: Dynamic models for the measurement of „traits“ in social behavior. In: W. Kempf, B. H. Repp (Hrsg.): Mathematical models for social psychology. Wiley, New York 1977, S. 14–58.
W. Kempf, R. Langeheine: Item-Response-Modelle in der sozialwissenschaftlichen Forschung. regener, Berlin 2012, ISBN 978-3-936014-29-7.
H. Müller: Summenscore und Trennschärfe beim Rasch-Modell. In: Psychologische Rundschau. Band 51, 2000, S. 34–35. doi:10.1026//0033-3042.51.1.34
Matthias von Davier, Claus H. Carstensen (Hrsg.): Multivariate and Mixture Distribution Rasch Models. Extensions and Applications. Springer, Berlin 2006, ISBN 0-387-32916-1.
G. Rasch: Probabilistic models for some intelligence and attainment tests. Danish Institute for Educational Research, Copenhagen 1960. (The University of Chicago Press, Chicago 1980, ISBN 0-226-70553-6)
J. Rost: Was ist aus dem Rasch-Modell geworden? In: Psychologische Rundschau. Band 50, 1999, S. 140–156. doi:10.1026//0033-3042.50.3.140
J. Rost: Testtheorie – Testkonstruktion. Huber, Göttingen 2003, ISBN 3-456-83964-2.

Einzelnachweise

↑ Fischer, G. H. (1974). Einführung in die Theorie psychologischer Tests. Grundlagen und Anwendungen. Bern: Huber, ISBN 3-456-80039-8.
↑ Molenaar, I. W. (1995). Estimations of Item Parameters. In G. H. Fischer & I. W. Molenaar (Hrsg.), Rasch models (S. 39–51). New York: Springer, ISBN 0-387-94499-0.
↑ Fischer, 1974
↑ Fischer, G. H. (1995). Derivations of the Rasch Model. In G. H. Fischer & I. W. Molenaar (Hrsg.), Rasch models (S. 15–38). New York: Springer, ISBN 0-387-94499-0.
↑ Scheiblechner, H. H. (2009). Rasch and pseudo-Rasch models: suitableness for practical test applications. Psychology Science Quarterly, 51, 181–194.
↑ Fischer, 1974
↑ Andersen, 1973
↑ Kubinger, K. D. (1989). Aktueller Stand und kritische Würdigung der Probabilistischen Testtheorie. In K. D. Kubinger (Hrsg.), Moderne Testtheorie - Ein Abriß samt neuesten Beiträgen (S. 19–83), (2. Aufl.). München: Psychologie Verlags Union.
↑ Glas, C. A. W., & Verhelst, N. D. (1995). Testing the Rasch Model. In G.H. Fischer & I.W. Molenaar (Eds.), Rasch models (pp. 69–95). New York: Springer.
↑ Strobl, C., Kopf, J., & Zeileis, A. (2015). Rasch Trees: A New Method for Detecting Differential Item Functioning. Psychometrika, 80, 289–316.

Weblinks

Wikibooks: Rasch-Analyse mit der freien Statistiksoftware R – Lern- und Lehrmaterialien

Etliche Software-Pakete sind auf dem Markt. Einige ausführbare Programme sind frei erhältlich, zum Teil allerdings nur als Demo-Version mit reduziertem Leistungsumfang. Auch Open-Source-Software ist verfügbar.

[1] Fischer, G. H. (1974). Einführung in die Theorie psychologischer Tests. Grundlagen und Anwendungen. Bern: Huber, ISBN 3-456-80039-8.

[2] Molenaar, I. W. (1995). Estimations of Item Parameters. In G. H. Fischer & I. W. Molenaar (Hrsg.), Rasch models (S. 39–51). New York: Springer, ISBN 0-387-94499-0.

[3] Fischer, 1974

[4] Fischer, G. H. (1995). Derivations of the Rasch Model. In G. H. Fischer & I. W. Molenaar (Hrsg.), Rasch models (S. 15–38). New York: Springer, ISBN 0-387-94499-0.

[5] Scheiblechner, H. H. (2009). Rasch and pseudo-Rasch models: suitableness for practical test applications. Psychology Science Quarterly, 51, 181–194.

[6] Fischer, 1974

[7] Andersen, 1973

[8] Kubinger, K. D. (1989). Aktueller Stand und kritische Würdigung der Probabilistischen Testtheorie. In K. D. Kubinger (Hrsg.), Moderne Testtheorie - Ein Abriß samt neuesten Beiträgen (S. 19–83), (2. Aufl.). München: Psychologie Verlags Union.

[9] Glas, C. A. W., & Verhelst, N. D. (1995). Testing the Rasch Model. In G.H. Fischer & I.W. Molenaar (Eds.), Rasch models (pp. 69–95). New York: Springer.

[10] Strobl, C., Kopf, J., & Zeileis, A. (2015). Rasch Trees: A New Method for Detecting Differential Item Functioning. Psychometrika, 80, 289–316.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

Rasch-Modell

Inhaltsverzeichnis