Forschungsdaten sind Daten, die unmittelbar im Forschungsprozess erfasst, erzeugt oder gewonnen werden. Dazu gehören zum Beispiel: Tier- und Pflanzenpräparate (Herbarbelege, Käfersammlung), medizinische Präparate und Materialproben, aber genauso auch digitalisierte und georeferenzierte Karten und Kartenwerke oder 3-D-Scans von archäologischen Funden.

Typen von Forschungsdaten

Rohdaten

  • die 'Original-Daten'
  • häufig "big data"
  • Herausforderung: sowohl analoge (und später digitalisierte) als auch originär digitale Daten, große Datenmengen
  • Grundlage für die Nachvollziehbarkeit der Primärdaten - ein Verlust der Rohdaten ist häufig nur schwer zu ersetzen

Primärdaten

  • verarbeitete Daten: Auswertung, Ergebnisse einer Analyse uvw.
  • häufig in verschiedenen Versionen und unterschiedlichen Datenformaten vorhanden
  • liegen fast immer bereits digital vor
  • sind reproduzierbar auf Grundlage der Rohdaten
  • Nutzung standardisierter Datenformate
  • Erfassung standardisierter Metadaten

Sekundärdaten

  • von den Primärdaten abgeleitet/erarbeitet (und damit von den Rohdaten)
  • liefern Antworten auf spezielle Fragestellungen
  • oft der Einstiegspunkt für weitere Nachnutzungen der Forschungsdaten

Lebenszyklus von Forschungsdaten

Planung/Erstellung:

  • Wer erhebt die Daten, erhält Lese-/Schreibrechte auf den Daten ...
  • Wann werden welche Daten benötigt, erhoben, weitergegeben ...
  • Wo werden die Daten erhoben, gespeichert, verarbeitet werden ...
  • Wie werden die Daten abgelegt, übergeben, verarbeitet werden ...
  • Welche Arten von Daten werden anfallen, verarbeitet, archiviert werden ...
  • Wieviele Daten werden voraussichtlich gespeichert, geteilt, archiviert werden ...
  • (Warum gerade diese Daten ...)
  • Was wird mit diesen Daten passieren: während des Projekts, nach dem Projekt ...
  • Warten auf Rückfragen: welche gesetzlichen Rahmenbedingungen sind zu beachten (personenbezogene Daten, Datenschutz, Datensicherheit) ....

⇒ Daten-Management-Plan erstellen, ggf. während des Projekts aktualisieren

Auswahl, Erhebung:

  • erforderliche Hard- und Software beschaffen:
    • Lizenzen/Kosten?
    • Datenformate - proprietär oder offen, kompatibel mit neuen Versionen der Software?
  • Umgang mit sensiblen/persönlichen Daten: Einwilligungserklärung einholen
  • regelmäßige Kontrolle der Datenqualität

Übernahme, Verarbeitung:

  • Dokumentation der verwendeten Methoden und Werkzeuge
  • Kompatibilität der Datenformate sicherstellen
  • fachspezifische Standards einhalten

Speicherung/Infrastruktur:

  • Datensparsamkeit - Auswahl der relevanten Daten
  • Aufbewahrungsdauer festlegen
  • Berechtiger Personenkreis für Zugriff und Nachnutzung

Erhaltungsmaßnahmen:

  • Prüfen, ob Datenformate noch aktuell sind, ggf. konvertieren

Zugriff/Nutzung:

  • passende Lizenz festlegen, z.B. cc-by, cc-0
  • FAIR-Prinzip anwenden
    • findable
    • accessible
    • interoperable
    • reusable