Matching (Statistik)Matching bzw. deutsch paarweise Zuordnung bezeichnet in der Statistik Methoden, mit denen ähnliche Beobachtungen in zwei oder mehr Datensätzen verbunden werden. Mit Matching-Methoden wird anhand gemeinsamer Merkmale den Beobachtungen aus einem Datensatz eine oder mehrere ähnliche Beobachtungen aus den anderen Datensätzen zugeordnet. Damit wird eine gemeinsame Analyse der Daten möglich, obwohl es vermutlich keinen Fall gibt, der in beiden Datensätzen tatsächlich vorkommt. In der Medizinstatistik wird Matching beim Design von Beobachtungsstudien angewandt. BeschreibungGegeben sind beispielsweise zwei Datensätze, die Ergebnisse einer Befragung zur Einkommenssituation und die einer anderen Befragung zu Lebensbedingungen. Die Befragten in beiden Datensätzen sind zwar verschieden, aber bei beiden Befragungen sind gemeinsame Merkmale (zum Beispiel Geschlecht, Altersgruppe, Wohnort usw.) erfasst worden. Mit Matching-Methoden wird nun den Beobachtungen aus einem Datensatz eine oder mehrere ähnliche Beobachtungen aus dem anderen Datensatz anhand dieser gemeinsamen Merkmale zugeordnet. Damit wird eine gemeinsame Analyse von Einkommenssituation und Lebensbedingungen möglich, obwohl es vermutlich keine Befragten gibt, die an beiden Befragungen teilgenommen haben. Die Qualität der Analyse von Einkommenssituation und Lebensbedingungen hängt stark von der Qualität des Matchings ab. Matching-VerfahrenSpezielle Matching-Verfahren sind:
AnwendungenIn der Medizinstatistik wird Matching beim Design von Beobachtungsstudien angewandt. Bei Fall-Kontroll-Studien können Fälle und Kontrollen so gewählt werden, dass sie in Bezug auf bestimmte Kriterien (zum Beispiel Geschlecht, sozioökonomischer Status, Altersgruppe) übereinstimmen.[7] Dies ist auf individueller Ebene (für jeden Fall wird eine in dem/den gewählten Kriterien übereinstimmende Kontrolle ausgesucht) oder als Gruppen-Matching (englisch frequency matching) möglich. Beim Gruppen-Matching wird die Zusammensetzung aller Kontrollen entsprechend der Zusammensetzung der Fälle gewählt. Wenn beispielsweise die Gruppe der Fälle zu 80 % aus Frauen besteht, wird die Kontrollgruppe mit einem ähnlichen Prozentsatz an Frauen zusammengestellt.[7] Bei individuell gematchten Fall-Kontroll-Studien, die mittels logistischer Regression analysiert werden, sollte eine Sonderform dieser Methode (konditionale logistische Regression) angewandt werden. Wenn individuell nach mehreren Faktoren gematcht wird, besteht die Gefahr, dass für Fälle keine Kontrollen gefunden werden, die entsprechend der Matching-Kriterien übereinstimmen. Siehe auchLiteratur
Einzelnachweise
|
Portal di Ensiklopedia Dunia