Datenqualität (GIS)In Geografischen Informationssystemen (GIS) versteht man unter Datenqualität die Güte von Geodaten. Damit wird also beschrieben, inwiefern Geodaten definierte Anforderungen erfüllen. Die Anforderungen und Kriterien werden in der Regel durch ein Qualitätsmodell bzw. Qualitätsstandard festgelegt und im Hinblick auf eine konkrete Fragestellung bewertet. Eines der bekanntesten Qualitätsmodelle ist die ISO 19157-Norm (ehemals ISO 19113) der Internationalen Organisation für Normung. Innerhalb des Qualitätsmodells beschreiben Qualitätsmerkmale, anhand welcher Ansätze die Qualität überprüft wird, die Qualitätsindikatoren legen dann fest, wie die Qualität konkret gemessen wird. Soll also beispielsweise die Qualität von Geodaten anhand ihrer Vollständigkeit beschrieben werden, muss ein weiterer Qualitätsindikator festgelegt werden, der die Qualität konkret misst. Dies könnte etwa durch Messung der Länge im Falle eines Straßengraphen-Datensatz oder der Flächengröße im Falle eines Forstdatensatz geschehen. Im Folgenden werden die Qualitätsmerkmale nach ISO 19157 und ihre Submerkmale (also untergeordneten Merkmale) beschrieben. Qualitätsmerkmale nach ISO 19157Vollständigkeit (Completeness)Die Vollständigkeit gibt an, wie groß die Wahrscheinlichkeit ist, dass für einen konkreten Anlassfall und zu einem konkreten Ort Daten vorhanden sind oder fehlen. Sind im Vergleich zur realen Welt oder für einen Anwendungsfall festgelegte Mindestanforderung zu wenig Informationen vorhanden, so fehlen Daten und man spricht von Datenmangel. Sind hingegen zu viele Informationen vorhanden, so handelt es sich um einen Überschuss. Submerkmale:
Beispiel für die Vollständigkeit:
Positionsgenauigkeit (Positional Accuracy)Die Positionsgenauigkeit gibt die Abweichung der Position der Geodaten vom wahren Wert an (oder wenn dieser nicht bekannt ist, vom Erwartungswert). Die Abweichung wird normalerweise in einer messbaren Einheit angegeben und aus einer statistischen Beurteilung ermittelt. Bei der Positionsgenauigkeit kann man zwischen absoluter und relativer Genauigkeit unterscheiden. Die absolute Genauigkeit beschreibt die Abweichung von den tatsächlichen Koordinaten des Objektes während die relative Genauigkeit angibt wie exakt die Richtungen und Distanzen zwischen zwei Punkten abgebildet wurden. Submerkmale:
Beispiel für die Positionsgenauigkeit:
Attributsgenauigkeit (Thematic Accuracy)Dieser Parameter bezieht sich auf die Ungenauigkeit der zugewiesenen Attribute. Er beschreibt also, wie korrekt die Attribute den entsprechenden Objekten in den Daten zugeordnet wurden. Diese Fehler können durch fehlerhafte Quelldateien, Fehlinterpretationen (menschliche Fehler) oder Datenbankfehler verursacht werden. Submerkmale:
Beispiel für die Attributsgenauigkeit:
Zeitliche Genauigkeit (Temporal Quality)Die zeitliche Genauigkeit beschreibt die Aktualität der Daten (zeitliche Gültigkeit), wie genau die Zeitangaben erfolgen und konsistent die Angaben erfolgen. Submerkmale:
Beispiel für die zeitliche Genauigkeit:
Logische Konsistenz (Logical Consistency)Die logische Konsistenz gibt an, inwiefern sich die Daten an vorher (in der Regel durch das Datenmodell) festgelegte Regeln hält. Hier wird insbesondere die topologische Konsistenz geprüft und ob die Beziehungen der Attribute und ihrer Werte untereinander stimmig sind. Submerkmale:
Beispiel für die logische Konsistenz:
Nutzungsziel bei der Datenerfassung und Gebrauchstauglichkeit (Usability)Dieses Qualitätsmerkmal beschreibt die Eignung eines Datensatzes für einen bestimmten Anwendungsfall (fitness for use), es kann dabei auch andere Qualitätsmerkmale berücksichtigen. Grundsätzlich sind die Anforderungen an die Datenqualität je nach Anwendungsfall sehr unterschiedlich, dieses Qualitätsmerkmal versucht diesen vielfältigen Anforderungen gerecht zu werden. Beispiel für die Gebrauchstauglichkeit:
Literatur
|
Portal di Ensiklopedia Dunia