Recommendations for Archiving Research Data
At the end of 2024 and beginning of 2025, staff members of the Göttingen Academy of Sciences and Humanities held three meetings to develop recommendations on data management and data archiving. These recommendations are now available for all projects and initiatives of the Göttingen Academy.
Presented in the form of guiding questions, the recommendations are intended to provide support for both the application, execution, and completion of projects concerning the archiving and maintenance of research data. They are based on an expanded definition of research data, which also includes the presentation of research outputs, for example in the form of dictionaries and editions, and is not limited to text and image data.
The recommendations can be downloaded here as a PDF (in German).
(As of: April 2025)
- 1. What data will be generated in the project?
- 2. Clarification of legal and ethical aspects
- 2.1. Licences, contracts, collaborations
- 2.2. CARE principles
- 3. Adherence to the FAIR principles
- 4. Archiving or deleting?
- 4.1. Identifying data to be archived
- 4.2. Deleting
- 5. How and where to archive and make available data?
- 5.1. Internal long-term archiving (Bitstream Preservation)
- 5.2. Provision of FAIR research data
- 5.3. Web archiving
- 6. Additional resources / secundary literature on research data management
Die Niedersächsische Akademie der Wissenschaften zu Göttingen (NAWG) empfiehlt die folgenden Maßnahmen und Schritte für Vorhaben aus dem Akademienprogramm und assoziierte Forschungsvorhaben, um eine nachhaltige Forschungsdatenarchivierung und -pflege sicherzustellen.
Allen laufenden Projekten wird dringend empfohlen, einen Datenmanagementplan (DMP) zu erstellen. Es gibt aktuell (April 2025) keine einheitliche Vorgabe auf der Ebene der Akademienunion. Für Neuvorhaben muss bei der Antragstellung ein Entwurf eines DMP beigefügt werden. Bei bestehenden Projekten schlagen wir die Verwendung des DMP der Bayerischen Akademie der Wissenschaften vor, der einen niedrigschwelligen Einstieg ermöglicht. Ein regelmäßiger Update-Rhythmus bzw. eine jährliche Überprüfung der Angaben ist essentiell.
Folgende strukturierte Vorgehensweise wird zur Erstellung eines DMP vorgeschlagen:
1. Welche Daten fallen im Projekt an?
2. Klärung rechtlicher und ethischer Aspekte
2.1. Lizenzen, Verträge, Kooperationen
2.2. CARE-Prinzipien
3. Beachtung der FAIR-Prinzipien
4. Archivieren oder löschen?
4.1. Zu archivierende Daten identifizieren
Der erste Schritt besteht darin, zu bestimmen, welche Daten in welchen Datenformaten archiviert werden. Zu archivierende Daten sind vor allem solche, die außerhalb des zu archivierenden Projekts für andere Forschende von Interesse sein könnten. Neben den Forschungsdaten, die im Fokus des Projektzwecks stehen, können dies z.B. für die Projektarbeit entwickelte Hilfsmittel, wie etwa Software, Verzeichnisse, Dokumentationen oder Datenbanken sein. Auch die Archivierung von Verwaltungsdaten eines Projekts (Anträge, Protokolle), die die wissenschaftliche Arbeit betreffen, ist zu prüfen.
4.2. Löschen
Daten, die nicht archiviert werden sollen, können während oder am Ende der Laufzeit gelöscht werden. Hier sollte das Mehrere-Augen-Prinzip beachtet werden bzw. ein Beschluss im Projektkontext unter Beteiligung aller ProjektmitarbeiterInnen herbeigeführt werden. Bei Verwaltungsdaten sollte im Zweifel Rücksprache mit der Geschäftsstelle erfolgen.
5. Wie und wo archivieren und bereitstellen?
5.1. Interne Archivierung für lange Zeiträume (Bitstream Preservation)
Entwicklung einer umfassenden Archivierungsstrategie. Sie sollte die folgenden Aspekte enthalten:
- Kriterien für die Datenarchivierung – oft mit unterschiedlichen Vorgaben für jeden Datentyp,
- die Mechanismen, die für den Archivierungsprozess zum Einsatz kommen,
- die Art der Medien [und Datenformate?], die für die Speicherung von Archivdaten verwendet werden,
- den Zeitraum, in dem Daten im Archiv bleiben; auch hier kann es je nach Datentyp Unterschiede geben,
- Regeln dazu, wer auf die Archive zugreifen darf und unter welchen Umständen.
Am Ende der Projektlaufzeit sollten die archivierten Daten hinsichtlich langfristiger Aufbewahrung überprüft werden.
5.2. Vorhaltung von FAIRen Forschungsdaten
Auswahl von Repositorien für die Bereitstellung nach den FAIR-Prinzipien (Findable, Accessible, Interoperable, Reusable). Beachtung der fachrelevanten Standards und Einbindung in die vorhandenen Forschungsdateninfrastrukturen (z.B. NFDI).
- Verwendung von zertifizierten Repositorien, z.B. res doctae oder GROdata
- Suchmöglichkeiten über die archivierten Forschungsdaten
- Persistente Identifikatoren (PID) verwenden, z.B. DOI
- Forschungsdatenpolicy der NAWG beachten (CC BY-SA 4.0)
- Möglichkeit der Bereitstellung als Linked Open Data (LOD) prüfen
Falls keine Möglichkeit besteht, die Daten FAIR bereitzustellen, sollten andere Möglichkeiten in Erwägung gezogen werden, die Daten zumindest öffentlich bereitzustellen.
5.3. Webarchivierung
Es besteht die Möglichkeit, nach Rücksprache mit der Digitalen Akademie Online-Inhalte von Akademieprojekten über das Webarchiv der NAWG (webarchiv.adw-goe.de) zu sichern. Eine Dokumentation dazu befindet sich demnächst auf der Webseite.
6. Wissenswertes / Sekundärliteratur zum Forschungsdatenmanagement
- https://forschungsdaten.info/themen/
- Wettlaufer_Fortbildung_2024_Datenarchivierung
- Markus et al. 2024: Long Term Archiving in the NFDI
- Markus et al. 2025: Long Term Data Issues
- Heseler et al. 2024: Grundlagen der digitalen Langzeitarchivierung (nfdi4culture)
- Zotero Group Library zur digitalen Langzeitarchivierung