Forschungsdaten sind Daten, die unmittelbar im Forschungsprozess erfasst, erzeugt oder gewonnen werden. Dazu gehören zum Beispiel: Tier- und Pflanzenpräparate (Herbarbelege, Käfersammlung), medizinische Präparate und Materialproben, aber genauso auch digitalisierte und georeferenzierte Karten und Kartenwerke oder 3-D-Scans von archäologischen Funden.
Typen von Forschungsdaten
Rohdaten
- die 'Original-Daten'
- häufig "big data"
- Herausforderung: sowohl analoge (und später digitalisierte) als auch originär digitale Daten, große Datenmengen
- Grundlage für die Nachvollziehbarkeit der Primärdaten - ein Verlust der Rohdaten ist häufig nur schwer zu ersetzen
Primärdaten
- verarbeitete Daten: Auswertung, Ergebnisse einer Analyse uvw.
- häufig in verschiedenen Versionen und unterschiedlichen Datenformaten vorhanden
- liegen fast immer bereits digital vor
- sind reproduzierbar auf Grundlage der Rohdaten
- Nutzung standardisierter Datenformate
- Erfassung standardisierter Metadaten
Sekundärdaten
- von den Primärdaten abgeleitet/erarbeitet (und damit von den Rohdaten)
- liefern Antworten auf spezielle Fragestellungen
- oft der Einstiegspunkt für weitere Nachnutzungen der Forschungsdaten
Lebenszyklus von Forschungsdaten
Planung/Erstellung:
- Wer erhebt die Daten, erhält Lese-/Schreibrechte auf den Daten ...
- Wann werden welche Daten benötigt, erhoben, weitergegeben ...
- Wo werden die Daten erhoben, gespeichert, verarbeitet werden ...
- Wie werden die Daten abgelegt, übergeben, verarbeitet werden ...
- Welche Arten von Daten werden anfallen, verarbeitet, archiviert werden ...
- Wieviele Daten werden voraussichtlich gespeichert, geteilt, archiviert werden ...
- (Warum gerade diese Daten ...)
- Was wird mit diesen Daten passieren: während des Projekts, nach dem Projekt ...
- Warten auf Rückfragen: welche gesetzlichen Rahmenbedingungen sind zu beachten (personenbezogene Daten, Datenschutz, Datensicherheit) ....
⇒ Daten-Management-Plan erstellen, ggf. während des Projekts aktualisieren
Auswahl, Erhebung:
- erforderliche Hard- und Software beschaffen:
- Lizenzen/Kosten?
- Datenformate - proprietär oder offen, kompatibel mit neuen Versionen der Software?
- Umgang mit sensiblen/persönlichen Daten: Einwilligungserklärung einholen
- regelmäßige Kontrolle der Datenqualität
Übernahme, Verarbeitung:
- Dokumentation der verwendeten Methoden und Werkzeuge
- Kompatibilität der Datenformate sicherstellen
- fachspezifische Standards einhalten
Speicherung/Infrastruktur:
- Datensparsamkeit - Auswahl der relevanten Daten
- Aufbewahrungsdauer festlegen
- Berechtiger Personenkreis für Zugriff und Nachnutzung
Erhaltungsmaßnahmen:
- Prüfen, ob Datenformate noch aktuell sind, ggf. konvertieren
Zugriff/Nutzung:
- passende Lizenz festlegen, z.B. cc-by, cc-0
- FAIR-Prinzip anwenden
- findable
- accessible
- interoperable
- reusable