Wie auch die Speichermedien folgen die Dateiformate dem Fortschritt der Technik. Ein langlebiges Dateiformat auszuwählen ist also relevant, um zu verhindern, dass Dateien unzugänglich werden, bevor ihr administrativer, juristischer oder historischer Wert vergeht.
- Was ist ein Dateiformat?
- Was ist ein langlebiges Dateiformat?
- Welche Dateiformate sind langlebig?
- Was geschieht mit Dateien in einem nicht in der Tabelle aufgeführten Format?
- Verweigert das Staatsarchiv Dateien in einem nicht in der Tabelle aufgeführten Format?
- Müssen bestimmte Dateien vor der Überführung noch konvertiert werden?
- Wie werden Dateiformate konvertiert?
- Wer ist verantwortlich?
- Was geschieht mit den Dateien nach der Überführung an das Staatsarchiv?
- Fragen oder Anmerkungen?
Was ist ein Dateiformat?
Eine Datei besteht aus einer digitalen binären Abfolge von Nullen und Einsen, deren Bedeutung vom Format der Datei abhängig ist. Das Dateiformat gibt an, wie die Datei angelegt wurde und wie sie gelesen werden kann. Es handelt sich dabei um Spezifikationen, wie ein Computer die binäre Abfolge liest.
Das Dateiformat ist also von grundlegender Wichtigkeit.
Was ist ein langlebiges Dateiformat?
Kein Dateiformat währt für die Ewigkeit, allerdings verringern die folgenden Eigenschaften die Wahrscheinlichkeit, dass das Format in Kürze überholt sein wird (und erhöhen somit seine Langlebigkeit):
- Offen (Open)
Im Gegensatz zu proprietären Dateiformaten sind die Definitionen von offenen Dateiformaten öffentlich zugänglich und können kostenlos verwendet werden, was es der Computergemeinde ermöglicht, eigene Anwendungen dafür zu entwickeln.
- Unabhängig
Im Gegensatz zu proprietären bzw. urheberrechtlich geschützten Dateiformaten sind unabhängige Formate nicht unter der Kontrolle einer Person oder eines Unternehmens. Somit ist man nicht abhängig von anderen oder von Gebühren, um Dateien in solchen Formaten anlegen, lesen und konvertieren zu können.
- Weit verbreitet
Für das Lesen und Verwalten von weit verbreiteten Dateiformaten besteht meist eine Vielzahl von Anwendungen, im Gegensatz zu wenig verbreiteten oder unbekannten Formaten. Falls es weit verbreitet ist, kann auch ein geschlossenes bzw. proprietäres Dateiformat wie z.B. PDF oder TIFF gegenüber einem offenen Format bevorzugt werden.
- Plattformunabhängig
Im Gegensatz zu plattformspezifischen Dateiformaten können plattformunabhängige Formate in jedem Fall von allen gängigen Betriebssystemen (Windows, Mac und Linux) geöffnet werden .
- Nicht komprimiert
Im Vergleich zu komprimierten Dateien, sind nicht komprimierte Dateien weniger anfällig für Datenverfall (engl. „bit rot“). Das Risiko, dass sie durch die Änderung eines einzigen Bytes unlesbar werden, ist viel geringer.
- Nicht zusammengeführt
Im Vergleich zu Containerformaten (Wrapper) sind nicht-zusammengeführte Dateien leichter zu überwachen und können einfacher konvertiert werden, wenn ihre Lesbarkeit gefährdet ist.
- Standardisiert
Im Vergleich zu nicht standardisierten Dateiformaten ist die Zukunftsfähigkeit und Verbreitung von auf Normen und Standards basierenden Dateiformaten besser sichergestellt.
Welche Dateiformate sind langlebig?
In der nachstehenden Tabelle sind Dateiformate aufgeführt, die für eine langfristige Aufbewahrung geeignet sind. Die zweite Spalte enthält die langlebigsten Dateiformate, in der dritten Stehen stehen ebenfalls annehmbare Formate.
Art der Informationen | Empfohlene Dateiformate | Annehmbare Dateiformate | Erklärungen |
---|---|---|---|
Textdokumente |
odt, txt1 |
docx, epub3, pdf/a2 |
1 Zeichenkodierung ASCII oder UTF-8 verwenden. 2 Das Dateiformat pdf/a-3 nicht verwenden, da hierin Dateien aller Art (langlebige und nicht langlebige) enthalten sein können. Unentbehrliche Objekte wie Tabellen und Abbildungen müssen stets zusätzlich separat von der PDF/A-Datei gespeichert werden, um ihre langfristige Aufbewahrung zu gewährleisten. Informationsverantwortliche müssen die Konformität der PDF-Dateien mit einem Validierungstool überprüfen und falls nötig ihre Arbeitsvorgänge anpassen, um zu verhindern, dass systematisch nicht konforme PDF/A-Dateien generiert werden. (Weitere Informationen auf der Seite PDF als Aufbewahrungsformat.) |
Präsentationen |
odp, odt |
pdf/a1, pptx |
Wichtige Abbildungen, Videos, Tonspuren etc. müssen separat gespeichert und verwaltet werden. 1 Siehe weiter oben. Nicht auswählen, falls dadurch Informationen verloren gehen, beispielsweise in Bezug auf Effekte. |
Tabellenkalkulation |
csv, ods |
pdf/a1, xlsx, xml |
Formeln sollten so oft wie möglich durch feste Werte ersetzt werden. Makros müssen aus Sicherheitsgründen deaktiviert werden. 1 Siehe weiter oben. |
Datenbanken |
csv, odb, sql, xml |
accdb, mdb, siard |
Die geeignete Methode hängt von der Art der Datenbank ab. Der Umgang mit Datenbanken muss stets vor der Überführung mit dem Staatsarchiv abgesprochen werden. Die mit der Datenbank verknüpften Tabellen (z.B. Nationalregisternummern) müssen ebenfalls überführt werden oder dauerhaft zugänglich bleiben; zudem muss Dokumentation über die Datenbank mitgeliefert werden, um die korrekte Interpretation der Struktur, der Trigger, Funktionen, Visualisierungen, externen Quellen usw. sicherzustellen. Eingebettete Dateien wie z.B. Bilder müssen separat aufbewahrt werden. So weit wie möglich die Kodierung UTF-8 verwenden. |
E-mails |
eml |
msg, mbox1, xml2 |
Abhängig von der Strategie für die Archivierung von E-Mails. 1 Ausschließlich als Alternative für pst. Eml ist zu bevorzugen. 2 Mit DTD oder xml-Schema. Kann mit Tools wie Aid4Mail aus anderen Formaten generiert werden. |
Normale Abbildungen (2D) |
dwg1, svg2, tiff3 |
cgm, dng, jp2, jpeg, jpg, odi, odg, png |
1 DWGDirect. 2 Kodierung UTF-8. 3 Nicht komprimiert. Zu bevorzugende Version des Formats: tiff 6.0. |
3D-Bilder, CAD-Zeichnungen, BIM-Modelle |
dxf, ifc, odg, svg1, x3d2 |
dwf, dwg |
1 Kodierung UTF-8. 2 Basierend auf xml oder vrml. |
Geographische Daten |
(geo)tiff, gml |
geojson, kml1 |
Alle notwendigen geographischen Metadaten müssen ebenfalls mitgeliefert werden (unter anderem das verwendete Projektionssystem). 1 Xml, kein Container. |
Audio |
bwf, oga, ogg1, wav2 |
aac, aiff2, flac, mp3, productieversie |
1 Audio-Streams in VORBIS-Kodierung. 2 Vorzugsweise (ausschließlich für Audio in Videos) mit PCM-Kodierung. |
Video |
dpx, mxf1 |
avi1, mkv2, mov3, mp44, ogg5 |
Für Audio in Videos: siehe „Audio“. Industriestandards einhalten. Kompression vermeiden. 1 Mit verlustfreien Einzelbildern im Format JPEG 2000. 2 Mit Videokodierung im Format mpeg-4-AVC(H.264) und Audiokodierung im Format FLAC. 3 Vorzugsweise mit 4:2:2 Farbunterabtastung. 4 Mit Videokodierung im Format mpeg-4-AVC(H.264) und Audiokodierung im Format mpeg-4-AAC. 5 Mit Videokodierung im Format THEORA und Audiokodierung im Format VORBIS. |
Websites |
warc1 oder Quelltext: html, css, js… |
|
Je nach Art der Website und Bedarf: weitere Informationen. 1 Herunterladbare und aufzubewahrende Dateien müssen separat gespeichert werden. |
Was geschieht mit Dateien in einem nicht in der Tabelle aufgeführten Format?
Von Dateien, die länger als 5 Jahre aufbewahrt werden müssen, wird eine Aufbewahrungskopie in einem langlebigen Dateiformat erstellt. Falls ein einziges langlebiges Dateiformat nicht ausreicht, um sowohl die textuellen Aspekte als auch andere Aspekte der Datei zu bewahren, werden Aufbewahrungskopien in mehreren Formaten angelegt.
Die Ursprungsdatei muss ebenfalls aufbewahrt werden für den Fall, dass neue Sicherheitskopien oder Kopien zur Einsichtnahme erstellt werden müssen, und um die Möglichkeit der Emulation zu bewahren.
Eine Aufbewahrungsformatetabelle (Vorlage) mit den digitalen Aktenreihen, die für eine dauerhafte Aufbewahrung oder für eine Aufbewahrung für mindestens 5 Jahre vorgesehen sind (siehe entsprechende Aussonderungsliste, hier zu finden), den jeweiligen Aufbewahrungsfristen und den erforderlichen Aufbewahrungsformaten, kann dabei helfen, eine strukturierte Herangehensweise auszuarbeiten. Der Informationsverantwortliche notiert darin, in welchen Formaten die Dateien erstellt wurden, ob sie textuelle und/oder andere Informationen enthalten (Abbildungen, Tonspuren, Unterschriften etc.), und in welchen Formaten die Aufbewahrungskopien angelegt werden müssen.
Durch das Anlegen von Dateien in langlebigen Dateiformaten wird vermieden, dass kurzfristig neue und zusätzliche Dateiversionen erstellt werden müssen, um die Lesbarkeit der Daten zu garantieren. Die Wahl eines geeigneten Dateiformats muss auf Ebene des Dienstes oder der Behörde beschlossen werden und darf nicht auf einer individuellen Entscheidung beruhen.
Verweigert das Staatsarchiv Dateien in einem nicht in der Tabelle aufgeführten Format?
Das Staatsarchiv verweigert alle Dateien, die zum Zeitpunkt der Überführung nicht mehr lesbar sind (die also nicht mehr mit einem leicht verfügbaren Hilfsprogramm geöffnet werden können). Die in der Tabelle aufgeführten Formate sind also nicht die einzigen, in denen Dateien an das Staatsarchiv überführt werden können. Als Archivbildner sind Sie verantwortlich für die Lesbarkeit der Dateien bis zum Zeitpunkt der Überführung.
Je nachdem, inwieweit dem Staatsarchiv ein Dateiformat vertraut ist, sind gegebenenfalls weitere Erklärungen seitens der überführenden Instanz erforderlich, um zu gewährleisten, dass die Dateien ordnungsgemäß aufbewahrt werden können. Mit welcher Software wurden die Dateien angelegt? Wie müssen sie geöffnet werden?
Aus verwaltungstechnischen und juristischen Gründen müssen außerdem die meisten Dateien zunächst für eine beträchtliche Dauer beim Archivbildner aufbewahrt werden. (Die standardmäßige Abgabefrist beträgt 30 Jahre und die administrative Aufbewahrungsfrist ist für viele Aktenreihen noch länger.) Es liegt also auch und vor allem im Interesse der überführenden Behörde, langlebige Dateiformate zu verwenden.
Müssen bestimmte Dateien vor der Überführung noch konvertiert werden?
Nein, es müssen keine Konvertierungen mehr stattfinden im Vorfeld der Überführung.
Falls die Dateien noch nicht in einem langlebigen Dateiformat vorhanden sind, erstellt das Staatsarchiv nach der Überführung eine Aufbewahrungskopie in einem langlebigen Format. Hierfür hat das Staatsarchiv gegebenenfalls zusätzliche Informationen nötig: Welche Verbindungen bestehen zwischen den Tabellen einer Datenbank? Welche Dateiformate sind in einem PDF-Dokument eingebettet? Diese Informationen werden vor der Überführung angefragt.
Wie werden Dateiformate konvertiert?
Dies ist abhängig vom Quell- und Zielformat, vom Umfang der Konvertierung (einige Dateien oder Massenkonvertierung), und davon, wie gut der Informationsverwalter die Befehlszeileneingabe (command line) beherrscht.
Eine aktuelle Übersicht von Konvertierungsprogrammen ist in der Datenbank COPTR zu finden.
Wer ist verantwortlich?
Die Wahl eines Speicherformats und das Anlegen von Aufbewahrungskopien liegen nicht in der jeweiligen Verantwortung des Einzelnen. Der ICT-Dienst oder der Informationsverantwortliche des betroffenen Dienstes oder der Behörde erarbeitet eine Strategie zur Festlegung der zu benutzenden Dateiformate und trägt dafür Sorge, dass Aufbewahrungskopien angelegt werden.
Das Staatsarchiv steht jederzeit zur Verfügung, um hierbei Hilfestellung zu leisten.
Was geschieht mit den Dateien nach der Überführung an das Staatsarchiv?
- Die Originaldateien werden aufbewahrt.
- Falls nötig legt das Staatsarchiv eine oder mehrere Aufbewahrungskopien in einem langlebigen Dateiformat an.
- Von den für die Öffentlichkeit zugänglichen Dateien legt das Staatsarchiv gegebenenfalls eine Ansichtskopie an, die besser auf die Bedürfnisse der Benutzer ausgelegt ist: in Formaten mit geringerer Dateigröße und die mit gängiger Software lesbar sind…
- Außerdem werden Sicherungskopien (Backup) an verschiedenen Standorten erstellt. Beschädigte Dateien, beispielsweise infolge von Datenverfall (engl. „bit rot“), werden durch eine Kopie anhand einer Sicherheitskopie ersetzt.