Dateiformate
Wissenschaftliche Daten sollten in einem Format gespeichert oder veröffentlicht werden, das auch in Zukunft möglichst lesbar sein wird, um zu garantieren, dass sie nicht verloren gehen.
Warum ist die Wahl des Formates wichtig für die Publikation auf RODARE oder die Langzeitarchivierung?
Digitale Objekte verschiedenster Art können schnell und teilweise einfach und ohne ein hohes Level an Hintergrundwissen erzeugt werden.
Dementsprechend viele Objekte werden auch täglich erstellt. Gerade im wissenschaftlichen Bereich ist es wichtig, manche dieser Objekte zu sichern und zwar so lange wie möglich. Denn wissenschaftliche Forschung soll auch in Zukunft nutzbar sein und häufig ist es nicht möglich, die Objekte wiederherzustellen oder zu reproduzieren, wenn sie verloren gehen.
Da aber auch Hardware, Software und Formate immer weiterentwickelt werden, laufen Daten Gefahr irgendwann unlesbar zu werden.
Die Wahl der richtigen Formate, die man bei Bedarf wird umwandeln können, ist daher für die Speicherung von Daten über einen längeren Zeitraum besonders wichtig.
Was ist bei Formaten im Hinblick auf die Publikation und Archivierung von (Forschungs-)Daten wichtig?
Es ist nicht möglich, vorherzusagen welche Formate sich in Zukunft durchsetzen werden. Es gibt aber einige allgemeine Richtlinien, die für die weitere Nutzung von Daten relevant sind:
Diese sind:
Offene Formate: Vermeide proprietäre Formate, die durch Software oder Patente eingeschränkt sind. Offene Formate ermöglichen eine Weiterentwicklung durch Dritte und sind weniger abhängig von bestimmten Herstellern.
Transparenz: Wähle Formate, die direkt analysiert werden können, z. B. durch Lesbarkeit in einem Text-Editor. Verwende standardisierte Textkodierungen wie Unicode.
Verbreitung: Entscheide dich für Formate, die weltweit verbreitet sind, um die Nutzbarkeit für viele Menschen sicherzustellen.
Verlustfreiheit: Verlustfreie Formate bewahren alle Originaldaten. Berücksichtige den langen Zeitraum der Archivierung und minimiere Datenverluste.
Standards und Dokumentation: Achte auf ausreichende Dokumentation oder Standards für das gewählte Datenformat.
Metadaten-Support: Nutze Formate, die die Eintragung von Metadaten ermöglichen, um die Daten besser zu verstehen und wiederzufinden.
Kategorie | Empfohlene Formate für Langzeitarchivierung | Proprietäre Formate |
---|---|---|
Dokumente | PDF/A, XML, ASCII, LaTeX | DOC (Microsoft Word), PAGES (Apple Pages) |
Bilder | TIFF, JPEG 2000, PNG | PSD (Adobe Photoshop), HEIC (Apple) |
Audio | WAV, FLAC | MP3 (teilweise proprietär), AAC (Apple) |
Video | MKV, AVI | MOV (Apple QuickTime), WMV (Microsoft) |
Datenbanken | CSV, XML, SQL (offene Implementierungen) | MDB (Microsoft Access), SQL (proprietäre Implementierungen) |
Text | TXT, UTF-8, Markdown | RTF (Microsoft), WPD (WordPerfect) |
Tabellenkalkulationen | CSV, ODS (OpenDocument Spreadsheet) | XLSX (Microsoft Excel), NUMBERS (Apple Numbers) |
Geodaten | GeoTIFF, Shapefile (SHP), NetCDF | KML (Google Earth), GDB (Esri Geodatabase) |
Statistische Daten | CSV, RData (R), NetCDF | SAV (SPSS), DTA (Stata) |
2D/3D Design |
SVG (Scalable Vector Graphics) und DXF (AutoCAD Drawing Interchange Format) für Vektorgraphike,Shapefile, CGM, X3D, 3MF |
DWG, CDR |
3D-Druck | AMF (Additive Manufacturing File Format), 3MF (3D Manufacturing Format) | |
Metadaten | XML, JSON, RDF, HDF5 | --- |
Bitte beachten Sie, dass diese Tabelle allgemeine Empfehlungen enthält und es wichtig ist, spezifische Anforderungen und Standards in Ihrem Kontext zu berücksichtigen.