E.     Archiveringsprocedures

3.     Informatiesystemen

3.1.    Kenmerken

Naast digitale kantoordocumenten beheren organisaties grote digitale informatiesystemen waarmee digitale informatie en documenten worden gecreëerd, beheerd en verspreid. Voorbeelden van dergelijke informatiesystemen zijn websites, geografische informatiesystemen, toepassingen voor het beheren van allerhande registers, het verlenen van vergunningen, postregistratie, dossieropvolging, enz.

Deze informatiesystemen hebben een aantal typische eigenschappen waardoor een afzonderlijke archiveringsprocedure noodzakelijk is. Deze eigenschappen zijn onder meer:

Uit deze kenmerken volgt dat 'capture' (identificeren, vastleggen en registreren) van de archiefdocumenten een essentieel onderdeel van de archiveringsprocedure voor informatiesystemen is. Op basis van archiefwaardering worden de archiefdocumenten in deze data-centrische informatiesystemen geïdentificeerd. Het dynamisch en interactief karakter van de informatiesystemen en de weinig vaste documentaire vorm van veel documenten maakt dit echter niet vanzelfsprekend.

3.2.    Informatiesysteem als vertrekpunt

Het uitgangspunt in de archiveringsprocedure is het informatiesysteem waarbinnen de documenten worden gecreëerd en beheerd. Er is een grote variëteit en complexiteit aan informatiesystemen zodat er nood is aan analyse van elk informatiesysteem en zijn specifieke eigenschappen. De architectuur, de functionaliteiten, de afhankelijkheden, de workflow, de interacties, enz. verschillen immers van systeem tot systeem zodat de archiveringsprocedure vanuit elk informatiesysteem zelf moet vertrekken om te achterhalen WAT, HOE en WANNEER wordt gearchiveerd (DAVID-beslissingsmodel). Aangezien de informatiesystemen doorgaans volledig centraal beheerd worden, is het antwoord op de WIE-vraag de systeemverantwoordelijke, al zijn hierop uitzonderingen mogelijk.

3.3    Workflow en instrumenten

De archiveringsprocedure voor informatiesystemen loopt net zoals die voor kantoordocumenten van creatie tot en met ontsluiting. Al heel vroeg worden de eerste stappen in de archiveringsprocedure gezet. De archiveringsprocedure start bij het ontwerpen en het ontwikkelen van het informatiesysteem waarbinnen de documenten worden gecreëerd en beheerd, dus nog vóór de eigenlijke creatie van de documenten zelf.

Ga naar stap 7 Ga naar stap 6 Ga naar stap 5 Ga naar stap 1 Ga naar stap 4 Ga naar stap 3 Ga naar stap 2 Lees richtlijn 7 Lees richtlijn 4 Lees richtlijn 2 Lees richtlijn 6

 

De procedure start bij het informeren van de archivaris en het registreren van metadata over het informatiesysteem.

De archiefvormer brengt de archivaris op de hoogte gebracht van de ontwikkeling van een nieuw informatiesysteem, de aanpassing van een bestaand informatiesysteem of de afbouw van een oud informatiesysteem. Deze meldingsverplichting wordt binnen de organisatie best als een formele stap in de algemene IT-procedure opgenomen. Het tijdstip van de melding is bij voorkeur zo vroeg mogelijk, zodat de archivaris de nodige tijd voor onderzoek heeft en nog kan anticiperen zonder achter de feiten te moet aanhollen. De essentie van de melding is dat de archivaris weet voor welk informatiesysteem een archiveringsoplossing nodig is en dat hij betrokken wordt bij de ontwikkeling, de aanpassing of de afbouw van informatiesystemen.

Aangezien de archivaris voor de volgende stappen in de archiveringsprocedure informatie nodig heeft over het informatiesysteem is het belangrijk dat zo vroeg mogelijk op een gestructureerde en georganiseerde wijze documentatie over het informatiesysteem wordt geregistreerd en bijgehouden. Metadata over informatiesystemen worden echter in zeer weinig administraties of IT-afdelingen systematisch bijgehouden. Op het ogenblik van archivering beschikken archivarissen bijgevolg enkel over het informatiesysteem zelf, in het beste geval aangevuld met mondeling verstrekte informatie. Het spreekt voor zich dat dit een onvoldoende basis is voor belangrijke beslissingen zoals de identificatie van archiefdocumenten, de archiefwaardering en het uitstippelen van de archiveringsstrategie.

De metadata over informatiesystemen worden geregistreerd en bijgehouden in een nieuw archiefinstrument: de beheersinventaris van digitale informatiesystemen. In deze beheersinventaris houden de archiefvormer, de systeemverantwoordelijke(n) en de archivaris vanaf de creatie metadata bij over het digitaal informatiesysteem. Het basisdatamodel voor deze beheersinventaris zijn de gegevensvelden die vanuit archiefstandpunt noodzakelijk zijn. Deze hebben betrekking op de ontstaanscontext, de technische context en de beheerscontext. Een dergelijke beheersinventaris kan echter ook andere doeleinden dienen zoals de helpdeskfunctie of het beheer van de IT-infrastructuur. Op die manier biedt de beheersinventaris een meerwaarde voor de hele organisatie en zijn de archiefvormer en de archivaris niet de enige belanghebbende partijen voor het up-to-date houden van de beheersinventaris. De beheersinventaris kan diverse vormen aannemen. Dit kan evolueren van een eenvoudig tekstbestand tot een meer geavanceerde databanktoepassing. De beheersinventaris van de stad Antwerpen bijvoorbeeld is een relationele databank met webinterface en dynamisch datamodel.

Op basis van de informatie in de beheersinventaris - eventueel aangevuld met bijkomende documentatie - identificeert de archivaris de archiefdocumenten binnen het systeem en onderzoekt hij of er documenten met archiefwaarde worden gecreëerd. De archivaris kan zich voor het onderzoek naar nieuwe systemen ook baseren op demo-versies of technische fiches van het informatiesysteem. Aangezien er in dit geval nog geen documenten gecreëerd zijn, is het belangrijk om de archiefwaardering te koppelen aan de werkprocessen waarbinnen de documenten worden gevormd en aan hun functie die ze daarbinnen vervullen. In het geval van aanpassingen aan of het afbouwen van bestaande systemen is het informatiesysteem zelf een belangrijke bron.

Met betrekking tot databanken dient de archivaris na te gaan of:

  • de databank op zich één archiefdocument is
  • de databank een aggregaat van archiefdocumenten is
  • de output van de databank de archiefdocumenten zijn

Bij het identificeren van het archiefdocument bakent de archivaris ook de grenzen van het archiefdocument af. Veel informatiesystemen zijn immers aan elkaar gekoppeld en halen informatie op uit externe bronnen. Op basis van identificatie van de archiefbescheiden en archiefwaardering bepaalt de archivaris of de externe informatie als onderdeel van dit informatiesysteem, of afzonderlijk wordt gearchiveerd.

Als er binnen het informatiesysteem geen archiefdocumenten worden gevormd, dan spreekt het voor zich dat er geen archiveringsprocedure wordt uitgewerkt en dat er vanuit archiveringsstandpunt ook geen bijzondere vereisten aan het informatiesysteem worden opgelegd.

Worden er binnen het informatiesysteem wel archiefdocumenten gecreëerd en beheerd, dan beantwoordt de archivaris de WAT- en WANNEER-vragen van het DAVID-beslissingsmodel. Het is van belang om deze vragen onmiddellijk te koppelen aan de bewaartermijn van de archiefdocumenten.

Archiefdocumenten met een beperkte bewaartermijn en waarvan de levensduur niet langer is dan de informatiesystemen zelf kunnen meer dan waarschijnlijk binnen de actieve informatiesystemen worden bewaard, terwijl voor documenten met een lange bewaartermijn een lange termijnoplossing buiten het informatiesysteem nodig is.

  • in het eerste geval ziet de archivaris er op toe dat de archiefdocumenten binnen de informatiesystemen worden bijgehouden en raadpleegbaar zijn
  • in het tweede geval zorgt de archivaris ervoor dat de archiefdocumenten als conceptuele objecten worden vastgelegd zodat in de toekomst weergave en interpretatie mogelijk is zonder het oorspronkelijk informatiesysteem.

Op basis van de identificatie van de archiefdocumenten en hun bewaartermijn gaat de archivaris na welke onderdelen van het informatiesysteem op lange termijn worden gearchiveerd. De keuze van de componenten van het informatiesysteem die al dan niet worden gearchiveerd is niet alleen afhankelijk van de klassieke archiefcriteria, maar ook van de technische vereisten om in de toekomst de archiefdocumenten op een getrouwe wijze te reconstrueren.

Een hulpmiddel bij het beantwoorden van de WAT-vraag is de voorstelling van een informatiesysteem als een samenstelling van drie interactieve lagen:

  • de data: de volledige databank, een deel van de databank of een bepaalde output
  • de logica: de elementen die de input behandelen en de output genereren
  • de tools: de programma’s voor input, output en weergave.

Deze drie lagen kunnen gekoppeld worden aan de componenten van het archiefdocument. Vanuit de identificatie van de essentiële en incidentele componenten van de archiefdocumenten komt vast te liggen welke laag of welke onderdelen van die laag worden gearchiveerd. Op die manier wordt bijvoorbeeld in de datalaag een onderscheid gemaakt tussen computerdata en archiefdocumenten wanneer niet de volledige databank het archiefdocument is. In dit geval zal op basis van de archiefwaardering een query worden gemaakt op basis waarvan de archiefdocumenten worden samengesteld. Dit resultaat wordt vervolgens buiten het databanksysteem geëxporteerd en gearchiveerd. Wanneer daarentegen het archiefdocument de databank zelf is, dient veel aandacht besteed te worden aan de structuur. Voor hiërarchische databanken is de parent-child relatie van belang, terwijl bij relationele databanken de relaties tussen de tabellen en de structuur van de records mee gearchiveerd moeten worden.

De context van het archiefdocument vormt hierop enigszins een uitzondering op want de context zit meestal niet in het informatiesysteem zelf vervat. Aangezien de context en de metadata van het informatiesysteem gedocumenteerd worden in de beheersinventaris van de digitale informatiesystemen, kunnen beide hieruit worden gedistilleerd.

Voor archiefdocumenten die in aanmerking komen voor lange termijnarchivering wordt best vastgelegd WANNEER ze buiten het informatiesysteem worden gebracht. Het antwoord op de WANNEER-vraag kan van meerdere factoren afhankelijk zijn:

  • beperkingen van het opslagsysteem
  • performantie van het informatiesysteem
  • ondersteuning van leveranciers
  • vervanging of upgrade door een nieuw informatiesysteem.

Ongeacht de bewaartermijn en op basis van de WAT- en WANNEER-vragen wordt in deze stap nagegaan of er bijzondere vereisten gelden voor het informatiesysteem met het oog op het creëren, bijhouden en gemakkelijk archiveren van goede digitale archiefdocumenten. Deze vereisten kunnen betrekking hebben op:

  • de encoding van de data: toepassen van standaarden, bijhouden documentatie
  • het bestandsformaat waarin de documenten worden opgeslagen en de kwaliteitsvereisten
  • de registratie van metadata
  • het bijhouden van wijzigingen of aanleggen van een historiek
  • het inbouwen van betrouwbaarheidswaarborgen en -maatregelen
  • het bijhouden van documentatie
  • voorzien van een archiveringsmodule zodat de documenten op een geautomatiseerde en eenvoudige wijze periodiek kunnen worden gearchiveerd.

Het vluchtige en interactieve karakter van informatiesystemen staat dikwijls haaks op de stabiele eigenschap van archiefdocumenten. De gegevens in databanken worden continu aangevuld of gewijzigd terwijl archiefdocumenten per definitie een vaste documentaire vorm met gefixeerde inhoud hebben. Vanwege de noodzaak om de gegevens te reconstrueren is het dikwijls aangewezen om een historiek van de gegevens bij te houden. Deze historiek kan zowel binnen de databank zelf, als buiten de databank in een logbestand worden bijgehouden. Als men deze laatste oplossing toepast, gebruikt men best niet zomaar de logbestanden die databank managementsystemen automatisch aanmaken. Deze logbestanden hebben hoofdzakelijk algemeen databankbeheer en recovery als doel, en zijn bijgevolg niet zo geschikt voor archiveringsdoeleinden. De standaard logbestanden bevatten ook te veel informatie die niet van belang is voor archivering, waardoor ze heel groot worden en niet gemakkelijk te ontcijferen zijn. Voor archivering is het beter om afzonderlijke logbestanden aan te leggen en op voorhand te bepalen welke acties worden geregistreerd en wat van die acties in het logbestand wordt bijgehouden. Op die manier beperkt men de omvang van de logbestanden en zorgt men ervoor dat ze het archiveringsdoel beter bereiken. Beide vragen worden best beantwoord vanuit de identificatie en de waardering van de archiefdocumenten. Het spreekt voor zich dat men van bij de creatie van databanken hier al rekening mee houdt. Dit geldt overigens ook voor de audit-trails die worden aangelegd en bijgehouden.

Ten laatste op het archiveringsmoment worden de archiefdocumenten omgezet naar een archiveringsformaat. Voor een aantal types digitale documenten zijn geschikte archiveringsformaten beschikbaar. De archiveringsformaten die een archiefdienst hanteert worden bij voorkeur op een formele wijze vastgelegd. Hierbij wordt voor elk formaat het formaatprofiel met de ideale archiveringsinstellingen gedefinieerd. Bij ontstentenis aan een geschikt archiveringsformaat worden de archiefdocumenten opgeslagen in een uitwisselingsformaat. Als het echt niet anders kan, is een applicatieformaat een (tijdelijke) oplossing.

Welk archiveringsformaat wordt gebruikt is hoofdzakelijk afhankelijk van WAT wordt gearchiveerd. Aangezien databanksystemen niet als dusdanig worden gearchiveerd, maar enkel de inhoud (of beter de documenten) kunnen dezelfde archiveringsformaten als voor kantoordocumenten gebruikt worden. Toegepast in de praktijk kan dit betekenen dat de gegevens van een GIS-applicatie als GML-documenten worden bijgehouden of dat de kaarten en plattegronden als GeoTIFF- of SVG-bestanden worden gearchiveerd. XML is samen met ASCII of Unicode het aangewezen archiveringsformaat voor puur tekstuele databanken. Binaire objecten die in een databank werden opgeslagen of de gegenereerde output kunnen best naar het archiveringsformaat worden omgezet dat het best aansluit bij hun type.

In de meeste gevallen is het aangewezen om bij het uitstippelen van de archiveringsprocedure een archiveringsformaat vast te leggen. In de praktijk is dit niet altijd mogelijk en wacht men beter af wat de opties zijn op het tijdstip van archivering. De informatietechnologie en de standaardisatie is immers voortdurend in evolutie.

Een volgende deelvraag in het HOE-aspect van het beslissingsmodel betreft het medium dat dient als overbrengings- en of lange termijndrager. De archiefdienst bepaalt welke dragers als overbrengingsmedium gebruikt worden. In principe komt elk type drager die de archiefdienst kan inlezen hiervoor in aanmerking. Overbrenging via netwerk is mogelijk, maar is geen evidentie wanneer grote hoeveelheden computerbestanden getransfereerd moeten worden. De archiefdienst zet de overgedragen bestanden over naar een geschikte lange termijndrager.

De zaken liggen complexer wanneer de archiefdienst de overbrengingsdrager ook als lange termijndrager wil gebruiken. In dit geval gelden strenge kwaliteitsvereisten voor het beschrijven en het manipuleren van deze dragers.

In de voorlaatste stap in de procedure worden de overgedragen documenten gecontroleerd. Net zoals bij de archivering van kantoordocumenten worden zowel de digitale archiefdocumenten als hun dragers gecontroleerd op hun volledigheid, kwaliteit en bijgeleverde metadata. Voorbeelden zijn: validatie van de XML-documenten, steekproefgewijze tests op binaire formaten, kwaliteitscontrole van de CD-R’s, enz.

Als de overdracht de kwaliteitscontrole niet doorstaat, moeten de fouten of problemen eerst rechtgezet worden en dienen bepaalde acties hernomen worden. Het is dus van belang dat de gegevens en/of documenten nog niet uit de informatiesystemen zijn verwijderd, maar dat hiermee wordt gewacht tot na een succesvolle kwaliteitscontrole.

Wanneer de overdracht aan alle kwaliteitsvereisten beantwoordt, kunnen de archiefdocumenten worden geregistreerd en ontsloten. De archiefvormer krijgt de toelating om de gearchiveerde documenten uit de informatiesystemen te verwijderen of het hele informatiesysteem af te bouwen.

Meer informatie is beschikbaar op de DAVID-website:

Andere webpagina's in dit hoofdstuk: