Dateiformate

Wissenschaftliche Daten sollten in einem Format gespeichert werden, das auch in Zukunft möglichst lesbar sein wird, um zu garantieren, dass sie nicht verloren gehen.

Warum ist die Wahl des Formates wichtig für die Publikatzion auf RODARE oder die Langzeitarchivierung? 

Foto: Data ©Copyright: Mit KI erstellt / https://tse2.mm.bing.net/th?id=OIG2.OIrpE7oNDUjbPv_rgcBI&pid=ImgGn / 20. Juni 2024 um 8:29 AM

Digitale Objekte verschiedenster Art können schnell und teilweise einfach und ohne ein hohes Level an Hintergrundwissen erzeugt werden.

Dementsprechend viele Objekte werden auch täglich erstellt. Gerade im wissenschaftlichen Bereich ist es wichtig, manche dieser Objekte zu sichern und zwar so lange wie möglich. Denn wissenschaftliche Forschung soll auch in Zukunft nutzbar sein und häufig ist es nicht möglich, die Objekte wiederherzustellen oder zu reproduzieren, wenn sie verloren gehen.

Da aber auch Hardware, Software und Formate immer weiterentwickelt werden, laufen Daten Gefahr irgendwann unlesbar zu werden.

Die Wahl der richtigen Formate, die man bei Bedarf wird umwandeln können, ist daher für die Speicherung von Daten über einen längeren Zeitraum besonders wichtig.


Was ist bei Formaten im Hinblick auf die Publikation und Archivierung von (Forschungs-)Daten wichtig?

Foto: Data at the HZDR ©Copyright: Mit KI erstellt / https://tse1.mm.bing.net/th?id=OIG2.z7Nw82RZSMyWHaIvjQ_M&pid=ImgGn / 20. Juni 2024 um 1:51 PM

Es ist nicht möglich, vorherzusagen welche Formate sich in Zukunft durchsetzen werden. Es gibt aber einige allgemeine Richtlinien, die für die weitere Nutzung von Daten relevant sind:

Diese sind:

Offene Formate: Vermeide proprietäre Formate, die durch Software oder Patente eingeschränkt sind. Offene Formate ermöglichen eine Weiterentwicklung durch Dritte und sind weniger abhängig von bestimmten Herstellern.

Transparenz: Wähle Formate, die direkt analysiert werden können, z. B. durch Lesbarkeit in einem Text-Editor. Verwende standardisierte Textkodierungen wie Unicode.

Verbreitung: Entscheide dich für Formate, die weltweit verbreitet sind, um die Nutzbarkeit für viele Menschen sicherzustellen.

Verlustfreiheit: Verlustfreie Formate bewahren alle Originaldaten. Berücksichtige den langen Zeitraum der Archivierung und minimiere Datenverluste.

Standards und Dokumentation: Achte auf ausreichende Dokumentation oder Standards für das gewählte Datenformat.

Metadaten-Support: Nutze Formate, die die Eintragung von Metadaten ermöglichen, um die Daten besser zu verstehen und wiederzufinden.


Kategorie Empfohlene Formate für Langzeitarchivierung Proprietäre Formate
Dokumente PDF/A, XML, ASCII, LaTeX DOC (Microsoft Word), PAGES (Apple Pages)
Bilder TIFF, JPEG 2000, PNG PSD (Adobe Photoshop), HEIC (Apple)
Audio WAV, FLAC MP3 (teilweise proprietär), AAC (Apple)
Video MKV, AVI MOV (Apple QuickTime), WMV (Microsoft)
Datenbanken CSV, XML, SQL (offene Implementierungen) MDB (Microsoft Access), SQL (proprietäre Implementierungen)
Text TXT, UTF-8, Markdown RTF (Microsoft), WPD (WordPerfect)
Tabellenkalkulationen CSV, ODS (OpenDocument Spreadsheet) XLSX (Microsoft Excel), NUMBERS (Apple Numbers)
Geodaten GeoTIFF, Shapefile (SHP), NetCDF KML (Google Earth), GDB (Esri Geodatabase)
Statistische Daten CSV, RData (R), NetCDF SAV (SPSS), DTA (Stata)

weiterführende Links