Forschungsdaten sind Daten, die bei Planung, Durchführung und Dokumentation wissenschaftlicher Vorhaben entstehen oder bei einem solchen Vorhaben verwendet werden. Sie bilden ein wesentliches Fundament wissenschaftlicher Arbeiten und dokumentieren deren Ergebnisse. Auswertung, Analyse und Interpretation der Forschungsdaten ermöglicht Schlussfolgerungen, erzeugt Information und liefert neue Erkenntnisse.[1][2][3][4][5]
Je nach Fachgebiet oder Forschungsvorhaben können Forschungsdaten auf ganz unterschiedliche Weise erzeugt werden (z. B. Beobachtungen, Experimente, Messungen, Erhebungen, Befragungen) und in ganz unterschiedlicher Form (z. B. Texte, Tabellen, Bilder, Messdaten oder Videos) vorliegen. Sie werden heutzutage fast immer in digitalen Formaten in strukturierter (z. B. Datenbanken, Dateien), semistrukturierter (z. B. XML) oder unstrukturierter (z. B. Dokumente, Texte, Grafiken) Form gespeichert. Sie unterliegen einem Lebenszyklus und stehen nach der Archivierung für Zwecke der Nachnutzung (wie Recherche, weitere Auswertung, Sekundärforschung) zur Verfügung.
Die Vielfalt wissenschaftlicher Disziplinen und Forschungsverfahren führt zu unterschiedlichem Verständnis des Begriffs Forschungsdaten und zu unterschiedlichen Anforderungen an die Handhabung (Aufbereitung, Auswertung, Verwaltung, Archivierung). Die Methoden zur Handhabung von Forschungsdaten sind Gegenstand des Forschungsdatenmanagements und der Forschungsdateninfrastruktur.[6]
Wissenschaftszweige wie Natur-, Sozial- und Wirtschaftswissenschaften, die vorwiegend mit quantitativen Methoden arbeiten, differenzieren Forschungsdaten häufig in Primär- oder Rohdaten und Sekundärdaten, manchmal auch in Ausgangsdaten und Ergebnisdaten. Geisteswissenschaften verwenden eher die Begriffe Quelle anstelle von Ausgangsdaten und Publikation anstelle von Ergebnisdaten und siedeln zwischen Quelle und Publikation die Ebene der Arbeitsdaten an.[7]
Forschungsdaten sind nach einer Definition der Allianz der deutschen Wissenschaftsorganisationen Daten, „die im Zuge wissenschaftlicher Vorhaben z. B. durch Digitalisierung, Quellenforschungen, Experimente, Messungen, Erhebungen oder Befragungen entstehen.“[2]
„Unter digitalen Forschungsdaten verstehen wir alle digital vorliegenden Daten, die während des Forschungsprozesses entstehen oder ihr Ergebnis sind. Der Forschungsprozess umfasst dabei den gesamten Kreislauf von der Forschungsdatengenerierung, zum Beispiel durch ein Experiment in den Naturwissenschaften, eine dokumentierte Beobachtung in einer Kulturwissenschaft oder eine empirische Studie in den Sozialwissenschaften, über die Bearbeitung und Analyse bis hin zur Publikation und Archivierung von Forschungsdaten. Digitale Forschungsdaten entstehen in allen Wissenschaftsdisziplinen und unter Anwendung verschiedener Methoden, abhängig von der Forschungsfrage. Dies hat zur Folge, dass sie in unterschiedlichen Medientypen, Aggregationsstufen und Datenformaten auftreten. Um das Bereitstellen von Forschungsdaten und ihre Nachnutzung zu ermöglichen, sind Metadaten und eine Datendokumentation essentiell, die den Kontext der Forschungsdaten beschreiben sowie die Werkzeuge, mit denen sie erzeugt, gespeichert, bearbeitet und analysiert wurden.“[3]
„Geisteswissenschaftlich Forschungsdaten sind alle jene Daten, die im Kontext einer geisteswissenschaftlichen Fragestellung und in der Arbeit mit den dabei eingesehenen Quellen, worunter auch Sekundärliteratur verstanden wird, für eine längerfristige und öffentliche Archivierung ausgewählt und aufbereitet werden.“[7]
Beispiele
Die Vielfalt von Forschungsdaten spiegelt sich in der Vielfalt unterschiedlicher wissenschaftlicher Disziplinen und Forschungsverfahren wider. Zu Forschungsdaten zählen beispielsweise[1][4]
Die DFG (Deutsche Forschungsgemeinschaft) zählt auch Objekte aus Sammlungen oder Proben, die bei der wissenschaftlichen Arbeit entstehen, entwickelt oder ausgewertet werden, zu den Forschungsdaten.[4]
Lebenszyklus
Forschungsdaten unterliegen einem Lebenszyklus, der sich wie folgt gliedern lässt:[5][6]
Planung des Forschungsvorhabens; dies beinhaltet auch Forschungsdaten aus vorangegangene Forschungsvorhaben zu sammeln und für die Nachnutzung aufzubereiten.
Aufbereitung, Auswertung und Analyse; hierbei kommen häufig Methoden der Primärdatenverarbeitung zum Einsatz.
Interpretation und Dokumentation.
Publikation der Ergebnisse.
Langzeitarchivierung gewährleistet die dauerhafte Verfügbarkeit. Die archivierten Daten stehen für Nachfolge-Forschungsvorhaben, für Sekundäranalysen und für die Lehre zur Verfügung.
Umgang mit Forschungsdaten
Sichere Verwaltung und Speicherung der Forschungsdaten über den gesamten Lebenszyklus von der Planung bis zur Langzeitarchivierung ist Aufgabe des Forschungsdatenmanagements.[6] Da Forschungsdaten eine wesentliche Grundlage für das wissenschaftliche Arbeiten bilden, leistet ihre nachhaltige Sicherung und Bereitstellung einen Beitrag zu Nachvollziehbarkeit und Qualitätssicherung der Daten, sowie der Reproduzierbarkeit. Hierdurch eröffnen sich Anschlussmöglichkeiten für weitere Forschungsvorhaben[4][9][10] und Technologietransfer.
Die EU setzt sich ebenfalls für einen offenen Zugang zumindest zu den Forschungsdaten ein, die mit öffentlichen Mitteln gefördert werden, und hält es für dringend erforderlich, „Daten aus verschiedenen Quellen über Sektoren und Disziplinen hinweg zugänglich machen, zusammenführen und weiterverwenden zu können“.[1]
In vielen Big Data Sciences ist es bereits langjährige etablierte Praxis, Forschungsdaten dauerhaft zu speichern und nachnutzbar zu machen. Ein Beispiel hierfür aus dem Bereich Erdsystemforschung und Umweltwissenschaften ist das DatenrepositoriumPANGAEA. Im Gegensatz dazu ist in vielen Long Tail-Disziplinen (also Forschungsbereichen außerhalb von Big Data) ein systematisches Forschungsdatenmanagement noch nicht etabliert.[10]
Forschungsdaten.info – Informationsplattform für Forschungsdatenmanagement, angestoßen und unterstützt durch das Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg
↑ abcArbeitsgruppe Forschungsdaten der Schwerpunktinitiative „Digitale Information“ der Allianz der deutschen Wissenschaftsorganisationen: Forschungsdatenmanagement – Eine Handreichung. Mai 2018, abgerufen am 9. Juli 2020.
↑ abSchwerpunktinitiative „Digitale Information“ der Allianz der deutschen Wissenschaftsorganisationen: Grundsätze zum Umgang mit Forschungsdaten. 24. Juni 2010, archiviert vom Original (nicht mehr online verfügbar) am 22. März 2016; abgerufen am 7. September 2020.Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.allianzinitiative.de
↑Clare Watson: Many researchers say they’ll share data — but don’t. In: Nature. Band606, Nr.7916, 30. Juni 2022, ISSN0028-0836, S.853–853, doi:10.1038/d41586-022-01692-1 (nature.com [abgerufen am 13. Juli 2022]).