C.    Archiveringsstandaarden

3.     Bestandsformaten

Digitale archiefdocumenten worden bij voorkeur in een gestandaardiseerd bestandsformaat opgeslagen. Gestandaardiseerde bestandsformaten zijn in de regel:

3.1.   Hiërarchie

In de IT-wereld bestaan tal van standaarden. Om het overzicht te behouden en als uitgangspunt in de keuze van een bepaald bestandsformaat kan men een hiërarchische indeling hanteren.

Bovenaan in de hiërarchie staan de officiële standaarden. Deze standaarden zijn vastgelegd door officiële standaardiseringsorganisaties en danken hun officiële status aan de participatie van een (inter-)gouvernementele organisatie. Bekende voorbeelden hiervan zijn ISO (International Organisation for Standardisation), IEC (International Electrotechnical Commission), ITU (International Telecommunications Union). Daarnaast zijn er veel officiële regionale en nationale standaardiseringsorganisaties.

Onder deze groep standaarden situeren zich de defacto standaarden. De defacto standaarden kunnen in drie subgroepen worden onderverdeeld. De specificaties zijn het resultaat van niet-officiële standaardiseringsinitiatieven (bijv. W3C). Hun beheer is niet in handen van één producent maar van een standaardiseringsinstantie. De open formaten zijn net zoals de specificaties publiek gedocumenteerd, maar hun beheer is in handen van één bepaalde producent. Tenslotte zijn er de gesloten formaten. Deze formaten danken hun status van defacto standaard aan hun wijdverspreidheid maar hun technische specificatie wordt niet vrijgegeven en ze zijn afhankelijk van één producent.

Bij het kiezen van een geschikt archiveringsformaat richt men zich bij voorkeur op de officiële standaarden en de specificaties. Enig pragmatisme is hierbij aanbevolen. De hiërarchie is een belangrijke leidraad maar is niet zaligmakend. De status van officiële standaard garandeert niets op zich. Zo kennen bepaalde specificaties een grotere toepassing dan hun officiële equivalenten (cf. Unicode vs. ISO-10646; XML vs. SGML). Naast de mate van standaardisatie gelden immers nog andere criteria voor geschikte archiveringsformaten.

3.2.   Geschikte archiveringsformaten

Een geschikt archiveringsformaat beantwoordt bij voorkeur aan volgende criteria:

Deze criteria zijn belangrijk in de keuze van een bepaald bestandsformaat als archiveringsformaat. Ook bij het toepassen van archiveringsstandaarden houdt men best deze kwaliteitsvereisten voor ogen. Standaarden kunnen immers op diverse wijzen worden toegepast. De meeste archiveringsformaten laten de gebruiker toe om een aantal instellingen en parameters te definiëren. Zo kan men diverse soorten TIFF-, XML- en PDF-bestanden produceren maar niet elk TIFF-, XML- of PDF-document is geschikt om op lange termijn te archiveren. Bij afbeeldingen die als TIFF-bestand worden bewaard, kan JPEG-compressie worden toegepast. Er gaan hierbij niet alleen gegevens verloren, maar voor de reconstructie is men afhankelijk van de overeenstemmende decompressie. De kwaliteit van XML-documenten is afhankelijk van de nesting en semantiek van de XML-tags. PDF-documenten bestemd voor lange termijnbewaring zijn bij voorkeur getagd of op zijn minst gestructureerd.

De gearchiveerde digitale archiefdocumenten zijn best zo autonoom mogelijk. De afhankelijkheden voor reconstructie worden best tot een absoluut minimum beperkt. Het ontbreken van één noodzakelijke schakel in het reconstructieproces kan immers tot verlies van het archiefdocument leiden. Omwille deze reden worden compressie, encryptie, paswoorden of andere beveiligingsinstellingen zoveel mogelijk vermeden.

Meer informatie over geschikte archiveringsformaten is beschikbaar op de DAVID-website:

Voor bepaalde types digitale informatie zijn (nog) geen geschikte archiveringsformaten beschikbaar. Deze digitale documenten zijn nauw verbonden met de hard- en softwareomgeving waarbinnen ze werden gecreëerd en kunnen nauwelijks of niet daar buiten worden gebruikt. Dit is momenteel het geval voor bepaalde multimedia-objecten. In dit geval is het aanbevolen om een bestandsformaat te zoeken dat aan zoveel mogelijk criteria van een geschikt archiveringsformaat beantwoordt en waarbij afhankelijkheden maximaal worden vermeden.

Aandachtspunt: archiveer geen gecomprimeerde digitale documenten!

Als compressie onvermijdelijk is, opteer dan voor een lossless compressiemethode (zonder informatieverlies) en kies een compressie met een open, gedocumenteerd en gestandaardiseerd decompressie-algoritme.

 

3.3.    Voorbeelden van geschikte archiveringsformaten

  TYPE DOCUMENT ARCHIVERINGSFORMAAT
  Tekst: ASCII/UNICODE, TIFF, PDF ofXML
  Afbeeldingen:  
    Raster: TIFF, PNG
    Vector: SVG
    Raster en vector: CGM
  Geluid: WAV
  CAD: DXF
  GIS GML
  Video: MXF

Tips en aanbevelingen:

Andere webpagina's in dit hoofdstuk