Bestandsformaten worden, zoals opslagmedia, op de hielen gezeten door de technologische vooruitgang. Een duurzaam formaat kiezen is belangrijk om te voorkomen dat bestanden ontoegankelijk worden voor hun administratief, juridisch of historisch belang is uitgespeeld.
- Wat is een bestandsformaat?
- Wat is een duurzaam bestandsformaat?
- Welke formaten zijn duurzaam?
- Wat met bestandsformaten die niet in bovenstaande tabel staan?
- Weigert het Rijksarchief bestandsformaten die niet in bovenstaande tabel staan?
- Moeten voor een overbrenging nog conversies gebeuren?
- Hoe converteer je één bestandsformaat naar een ander?
- Wie is verantwoordelijk?
- Wat gebeurt er met je bestanden nadat ze zijn overgebracht?
- Vraag of opmerking?
Wat is een bestandsformaat?
Digitale bestanden bestaan uit een reeks nullen en enen. Wat die betekenen, is afhankelijk van het bestandsformaat. Het bestandsformaat zegt hoe de reeks gegenereerd is en opnieuw ontcijferd kan worden. Het zijn de afspraken die aangeven hoe de computer de binaire sequentie moet lezen.
Het is dus een essentieel stukje informatie.
Wat is een duurzaam bestandsformaat?
Geen enkel formaat is gemaakt voor de eeuwigheid, maar volgende eigenschappen maken het minder waarschijnlijk dat een bestandsformaat op korte termijn voorbijgestreefd zal worden (en maken een formaat dus duurzaam):
- Open
In tegenstelling tot gesloten formaten, is de definitie van een open formaat publiek en het gebruik ervan vrij, waardoor de volledige computergemeenschap er toepassingen voor kan ontwikkelen.
- Onafhankelijk
In tegenstelling tot propriëtaire of eigendomsmatige formaten, wordt een onafhankelijk formaat niet gecontroleerd door een persoon of bedrijf. Je bent dus niet afhankelijk van anderen of van een abonnement voor het aanmaken, lezen en omzetten van bestanden in dit formaat.
- Wijd verspreid
Voor het lezen en beheren van ingeburgerde formaten bestaan meestal veel instrumenten, in tegenstelling tot voor obscure formaten of nicheformaten. Een gesloten en/of propriëtair formaat, zoals pdf of tiff, kan de voorkeur genieten boven een open formaat, als het heel ruim verspreid is.
- Platformonafhankelijk
In tegenstelling tot platformspecifieke formaten, kunnen platformonafhankelijke formaten in elk van de gangbare besturingssystemen (Windows, Mac en Linux) geopend worden.
- Niet gecomprimeerd
In vergelijking met gecomprimeerde bestanden, zijn niet-gecomprimeerde bestanden minder gevoelig voor bitrot. Het risico dat ze onleesbaar worden door de verandering van één enkele byte is veel kleiner.
- Niet samengesteld
In vergelijking met containerformaten of wrappers, zijn niet-samengestelde bestanden gemakkelijker te monitoren en om te zetten als hun leesbaarheid in het gedrang komt.
- Gestandaardiseerd
In vergelijking met niet-gestandaardiseerde formaten, is de toekomst en verspreiding van formaten die beschreven zijn in een norm of standaard beter verzekerd.
Welke formaten zijn duurzaam?
In de onderstaande tabel vind je de extensies van bestandsformaten die geschikt zijn voor langdurige bewaring. De tweede kolom bevat de meest duurzame formaten, de derde kolom formaten die aanvaardbaar zijn.
Informatietype | Voorkeursformaten | Aanvaardbare formaten | Toelichting |
---|---|---|---|
Tekstdocumenten |
odt, txt1 |
docx, epub3, pdf/a2 |
1 Tekencodering ASCII of UTF-8 gebruiken. 2 Zo veel mogelijk pdf/a-2 gebruiken (bijvoorbeeld door documenten op te slaan met PDFCreator). Geen pdf/a-3 gebruiken, omdat hierin bestanden van elk type (duurzaam en niet duurzaam) ingesloten kunnen worden. Onmisbare objecten zoals tabellen en afbeeldingen moeten altijd nog afzonderlijk van de pdf/a bewaard worden om hun bewaring op lange termijn te garanderen. Informatieverantwoordelijken moeten de conformiteit van pdf’s controleren met validatietools en indien nodig workflows bijsturen om te vermijden dat systematisch niet-conforme pdf/a’s gegenereerd worden. (Meer info op de pagina Pdf als bewaarformaat.) |
Presentaties |
odp, odt |
pdf/a1, pptx |
Belangrijke afbeeldingen, video’s, geluiden… moeten afzonderlijk opgeslagen en beheerd worden. 1 Zie hierboven. Niet voor opteren als daardoor informatie wegvalt, bijvoorbeeld als gevolg van effecten. |
Rekenbladen |
csv, ods |
pdf/a1, xlsx, xml |
Formules moeten zo veel mogelijk vervangen worden door vaste waarden. Macro’s moeten uitgeschakeld worden uit veiligheidsoverwegingen. 1 Zie hierboven. |
Databanken |
csv, odb, sql, xml |
accdb, mdb, siard |
De geschikte methode is afhankelijk van de aard van de databank. Databanken worden altijd besproken met het Rijksarchief voorafgaand aan een overbrenging. Gerelateerde tabellen (bv. met Rijksregisternummers) moeten mee overgebracht worden of toegankelijk zijn en documentatie over de databank moet aangeleverd worden, voor een goed begrip van de structuur, triggers, functies, visualisaties, externe bronnen e.d. Ingebedde bestanden, zoals afbeeldingen, moeten afzonderlijk bewaard worden. Zoveel mogelijk tekencodering UTF-8 gebruiken. |
E-mails |
eml |
msg, mbox1, xml2 |
Afhankelijk van de strategie voor e-mailarchivering. 1 Enkel als alternatief voor pst. Eml geniet de voorkeur. 2 Met DTD of xml-schema. Kan gecreëerd worden uit andere formaten met tools als Aid4Mail. |
Gewone afbeeldingen (2D) |
dwg1, svg2, tiff3 |
cgm, dng, jp2, jpeg, jpg, odi, odg, png |
1 DWGDirect. 2 Tekencodering UTF-8. 3 Niet gecomprimeerd. Beste keuze van alle formaten: tiff 6.0. |
3D-afbeeldingen, CAD-tekeningen, BIM-modellen |
dxf, ifc, odg, svg1, x3d2 |
dwf, dwg |
1 Tekencodering UTF-8. 2 Gebaseerd op xml of vrml. |
Geografische gegevens |
(geo)tiff, gml |
geojson, kml1 |
Alle noodzakelijke geografische metagegevens aanleveren (o.a. het gebruikte projectiesysteem). 1 Xml, geen container. |
Audio |
bwf, oga, ogg1, wav2 |
aac, aiff2, flac, mp3, productieversie |
1 Flux audiocodering VORBIS. 2 Best (voor audio bij video’s uitsluitend) met PCM-codering. |
Video |
dpx, mxf1 |
avi1, mkv2, mov3, mp44, ogg5 |
Voor de audio bij video’s: zie audio. Industriestandaarden volgen. Compressie vermijden. 1 Met verliesloze JPEG 2000 beeldframes. 2 Met videocodering mpeg-4-AVC(H.264) en audiocodering FLAC. 3 Best met 4:2:2 chroma subsample. 4 Met videocodering mpeg-4-AVC(H.264) en audiocodering mpeg-4-AAC. 5 Met videocodering THEORA en audiocodering VORBIS. |
Websites |
warc1 of broncode: html, css, js… |
|
Afhankelijk van de website en je behoeften: meer info. 1 Downloadbare bestanden die zeker bewaard moeten worden afzonderlijk bewaren. |
Wat met bestandsformaten die niet in bovenstaande de tabel staan?
Van bestanden die langer dan 5 jaar bewaard moeten worden, maak je een bewaarkopie in een duurzaam formaat. Als één duurzaam formaat niet volstaat om zowel de tekstuele als andere aspecten van het bestand te vrijwaren, maak je bewaarkopieën in meerdere formaten.
Het origineel bewaar je ook, voor als er nieuwe bewaar- of raadplegingskopieën gemaakt moeten worden en om de mogelijkheid van emulatie open te houden.
Een bewaarformatentabel (sjabloon), met daarin de digitale reeksen die bestemd zijn voor permanente bewaring of die minstens 5 jaar bewaard moeten worden (zie je selectielijst, hier te vinden), hun bewaartermijn en de nodige bewaarformaten, zal je helpen om een gestructureerde aanpak te ontwikkelen. De informatieverantwoordelijke noteert daarin in welk formaat ze zijn opgesteld, of ze tekstuele en/of andere informatie bevatten (afbeeldingen, geluiden, handtekeningen…) en in welk(e) formaat/formaten er bewaarkopieën gemaakt moeten worden.
Door bestanden in een duurzaam formaat te creëren, vermijd je dat er op korte termijn extra versies nodig zijn om de leesbaarheid te garanderen. De keuze voor bepaalde bestandsformaten moet overigens op dienst- of organisatieniveau genomen worden, niet individueel.
Weigert het Rijksarchief bestandsformaten die niet in bovenstaande tabel staan?
Het Rijksarchief zal alleen bestanden weigeren die niet meer leesbaar zijn (i.e. raadpleegbaar met een eenvoudig beschikbare tool) op het moment dat ze worden aangeboden. De formaten in de tabel zijn dus niet de enige die overgebracht kunnen worden. Als archiefvormer ben je verantwoordelijk om de leesbaarheid van de bestanden tot dat moment te garanderen.
Afhankelijk van of we vertrouwd zijn met het formaat, kan extra toelichting nodig zijn om ons in staat te stellen de bestanden na hun overbrengen goed te bewaren. Met welke software zijn de bestanden gemaakt? Hoe moeten ze geraadpleegd worden?...
De meeste bestanden moeten overigens om administratieve en juridische redenen eerst geruime tijd door de archiefvormer zelf bewaard worden. (De standaard overbrengingstermijn is 30 jaar en de administratieve bewaartermijn voor veel reeksen nog langer.) Het is dus ook en vooral in het belang van je organisatie om duurzame bestandsformaten te gebruiken.
Moeten voor een overbrenging nog conversies gebeuren?
Nee, in de aanloop naar een overbrenging moet je geen conversies meer doen.
Als je bestanden nog niet in een duurzaam formaat bestaan, maken wij deze aan na de overbrenging. Hiervoor hebben we soms wel bijkomende informatie nodig: welke relaties er zijn tussen tabellen in een database? welke bestandtypes zijn ingebed in een pdf?… Die informatie vragen we op voor je de bestanden overbrengt.
Hoe converteer je één bestandsformaat naar een ander?
Dit is afhankelijk van de bron- en doelformaten, de schaal waarop de conversie moet gebeuren (enkele bestanden of in bulk) en de vertrouwdheid van de informatiebeheerder met de command line.
Je vindt een actueel overzicht van conversietools in de databank COPTR.
Wie is verantwoordelijk?
Opslagformaten kiezen en bewaarkopieën maken is geen individuele verantwoordelijkheid. De ICT-dienst of informatieverantwoordelijke van je dienst of organisatie stippelt best een strategie uit, beslist welke formaten gebruikt moeten worden en zorgt voor bewaarkopieën.
Het Rijksarchief is altijd bereid hen hierin bij te staan.
Wat gebeurt er met je bestanden nadat ze zijn overgebracht?
- Je originele bestanden worden bewaard.
- Indien nodig, maken we één of meer bewaarkopieën in duurzame formaten.
- Mogelijk wordt van bestanden die toegankelijk zijn voor het publiek een raadplegingskopie gemaakt, die beter voldoet aan de noden van gebruikers: kleiner bestandsformaat, leesbaar met gangbare software…
- Daarnaast zorgen we voor back-ups op verschillende locaties. Aangetaste bestanden, bijvoorbeeld door bitrot, worden vervangen door een kopie van een back-upbestand.