Formaten voor audio

Inhoud

Inleiding

Heel wat erfgoedinstellingen bezitten naast geschreven documenten op papier of perkament, vaak minder conventioneel historisch materiaal. Geluidsdocumenten zijn daar een voorbeeld van. Het raadplegen en bewaren van dergelijke documenten is verre van evident.

In een digitaliseringsproject wordt men geconfronteerd met een aantal keuzes. Naast organisatorische of budgetaire keuzes moet er ook op technisch vlak een aantal knopen doorgehakt worden. Digitaal geluid komt immers in een waaier van verschijningsvormen voor. Kiest men voor een optische of voor een magnetische drager om data op lange termijn te bewaren? Is MP3 wel het beste bestandsformaat? Zijn er regels voor het toekennen van bestandsnamen? Een slecht afgewogen keuze kan de leesbaarheid op lange termijn in het gedrang brengen.

In de huidige situatie verouderen digitale formaten en software razendsnel. Het omzetten van data in een nieuw formaat houdt het risico op kwaliteit- en informatieverlies in. Het gebruik van geschikte archiveringsformaten en dragers kan dan ook niet onderschat worden. Bovendien is het van belang om het digitaliseringsproces te documenteren. Alleen dan kan men gedigitaliseerd archiefmateriaal optimaal bewaren en in de toekomst blijven raadplegen.

Het technische rapport rond digitaal geluidsarchief reikt een aantal krachtlijnen en aanbevelingen aan die instellingen in staat moet stellen bij weloverwogen keuzes te maken.

   VANDERMAESEN M. en BAATEN L., Digitaal geluidsarchief. Krachtlijnen digitalisering: Standaarden,
   formaten en dragers, Antwerpen, Stadsarchief Antwerpen, 2004. 1

Aanbevelingen

Formaten voor audiobestanden

  • Moederkopie: cDAVID raadt het gebruik van het WAV formaat aan wanneer men een moederkopie creëert. Deze moederkopie dient voor archiveringsdoeleinden (bewaring en reproductie van raadplegingkopieën of nieuwe moederkopieën)
  • Raadplegingkopie: De keuze van een geschikt distributieformaat dient eerder te beantwoorden aan de wensen en de noden van de eindgebruiker (snel en gebruiksvriendelijk verkrijgen van informatie) dan aan de rigoureuze bewaringseisen van een archivaris. Hoewel formaten zoals RealMedia of Windows Media Audio hun nut hebben bewezen raadt cDAVID het gebruik van een gestandaardiseerd formaat zoals MP3 of AAC aan.
  • cDAVID verwijst eveneens naar de DAVID Richtlijn 9 [link] en het DAVID Vademecum [link] voor de keuze van een geschikt archiveringsformaat.

Standaarden voor geluidsdragers

  • cDAVID beveelt het gebruik van de Compact Disk aan voor de lange termijn bewaring van gedigitaliseerde archiefdocumenten enerzijds en het ter beschikking stellen van deze documenten anderzijds.
  • Bij het schrijven van een audio-cd dient men de IEC-908 standaard toe te passen. Dit gebeurt veelal automatisch door de schrijfapplicatie zelf.
  • Bij het schrijven van een gegevenscd dient men erop te letten dat de optie: Mode 1: CD-ROM wordt toegepast door de schrijfapplicatie.
  • cDAVID beveelt het gebruik van de ISO-9660 standaard aan voor de logische structuur van de cd (bestandsnamen, mappenstructuur, etcetera). De digitaliseerder past deze norm toe bij het branden van een cd.
  • cDAVID raadt het gebruik van multisessie af. Het toevoegen van data op verschillende tijdstippen betekent een grotere kans op fouten. Beter is het om een cd in één keer te schrijven met de optie disk-at-once.
  • cDAVID raadt het gebruik van mixed mode af. Het is beter om audiotracks en computerbestanden op aparte cd's te bewaren.
  • cDAVID raadt aan om metadata in de bestanden zelf te bewaren (bijvoorbeeld in de header) dit om het gebruik van (losse) externe documentatie (etikettering op de cd, hoes,…) zoveel mogelijk te vermijden.

Formaten voor audiobestanden

Officiële standaarden
Acroniem Wat? Appreciatie
MP3 Moving Picture Experts Group 1 audio layer 3 Het MP3 formaat is een verlieslatende open standaard. Bij het comprimeren (verkleinen van de hoeveelheid data)ontstaat er een nadelig informatieverlies waardoor dit geen geschikt archiveringsformaat is voor lange termijn bewaring. De mogelijkheid om data met een ratio van 12:1 te verkleinen maakt dat dit formaat geschikt is voor raadplegingskopieën. De eerder kleine bestandsgrootte van een MP3 gecodeerde bitstream betekent immers een kleiner verbruik van bandbreedte en schijfruimte.
AAC Moving Picture Experts Group 2/4 Advanced Audio Coding AAC is de logische opvolger van MP3. Net zoals MP3 maakt AAC gebruik van verlieslatende compressie waardoor dit formaat ongeschikt is om voor lange termijn bewaring. AAC kan men wel als alternatief voor MP3 gebruiken.
De facto standaarden
Acroniem Wat? Appreciatie
WAV WAVEform Audio Format Door het gebruik van codecs kan het WAV file formaat voor heel wat doeleinden gebruikt worden. WAV is dan ook een hybride formaat. In combinatie met de 'uncompressed PCM' codec kan men WAV gebruiken om een originele bitstream als digitale moederkopie op te slaan. WAV in combinatie met een codec die een verlieslatend compressiealgoritme implementeert - zoals de MP3 codec - is af te raden bij de opbouw van een digitale moederkopie. Het gebruik van codecs waarvan de specificatie niet is vrijgegeven (en dus gesloten zijn) is af te raden.
AIFF Audio Interchange File Format Hoewel AIFF op het eerste zicht geschikt lijkt naar lange termijnbewaring toe (geen compressie, metadata, uitgebreide instelbare parameters) is het door zijn gesloten karakter geen geschikt archiveringsformaat. AIFF kan wel gebruikt worden om raadplegingkopieën van hoge kwaliteit af te leveren voor professioneel gebruik.
AU/SND Access Unit Niet tegenstaande het AU formaat ongecomprimeerde PCM codering van de bitstream toestaat, is het geen geschikt archiveringsformaat omdat het een gesloten de facto standaard is. AU biedt ook niet dezelfde mogelijkheden zoals WAV of AIFF wat betreft het inkapselen van technische en administratieve metadata.

Standaarden voor geluidsdragers

In onderstaande tabellen vindt u een overzicht van gangbare dragers voor digitale (geluids)bestanden. Wat betreft magnetische dragers kunnen we het onderscheid maken tussen verschillende types: de open spoel, de cassette, de cartridge de diskette en de hard disk. De laatste twee dragers vallen buiten beschouwing. Diskettes en harde schijven hebben een beperkte levensduur, zijn kwetsbaar en laten geen platformonafhankelijke opslag van data toe. Daardoor zijn ze allerminst geschikt om data op lange termijn te bewaren.

Magnetische dragers
Acroniem Wat? Appreciatie
DDS Digital Data Storage De bekendste magnetische tape van deze familie is de DAT (Digital Audio Tape). DDS is geen geschikte archiveringsdrager door de manier waarop data gelezen en geschreven wordt (Helical Scan) treedt er snel slijtage op.
DLT Digital Linear Tape DLT is een geschikte archiefdrager.
LTO Linear Tape Open LTO is geen geschikte archiefdrager. Deze drager is slechts een de facto gestandaardiseerd type.
QIC Quarter Inch Cartridge QIC is geen geschikte archiefdrager omdat dit formaat gebruik maakt van hardwarematige compressie om data op te slaan. Compressie moet bij de digital moederkopie vermeden worden. Compressie bouwt impliceert een bijkomende platformafhankelijkheid wat in strijd is met de DAVID aanbeveling om digitale data platformonafhankelijk te bewaren.

Op dit moment zijn de twee bekendste optische dragers de Compact Disk (cd) en de Digital Versatile Disk (DVD). Daarnaast bestaan er nog tal van anderen zoals de Minidisk, de Videodisk, etcetera. Naar archivering toe is enkel de Compact Disk de meest geschikte drager. De cd beantoordt aan alle eisen: er bestaan officiële standaarden, wijd verspreid gebruik, fout- correctie, uitwisselbaar, etcetera.

Optische dragers
Naam Wat?
Audio-cd: IEC-908 'Red Book' Dit is de standaard waaraan men moet voldoen om een audio-cd te schrijven. Een audio-cd kan 74 tot 80 minuten geluid of 99 afzonderlijke tracks (geluidsopnamen) bevatten. De IEC-908 standaard voorziet geen velden voor het beschrijven van metadata. De 'CD-text' uitbreiding die later aan de standaard werd toegevoegd, laat dit wel toe.
Gegevens-cd: ISO-10149 'Yellow Book' Dit is de standaard waaraan men moet voldoen om een gegevens-cd te schrijven. Een gegevenscd kan tot 700Mb aan digitale data opslaan. Deze standaard biedt 2 manieren om data te schrijven. cDAVID raadt het gebruik van 'Mode 1: CD-ROM' aan

Het opslaan van digitaal geluid gebeurt bij voorkeur in WAV bestanden (uncompressed PCM) die gebrand worden op een gegevenscd.

  • Het WAV formaat laat veel meer mogelijkheden toe wat betreft het beheren van metadata dan de Red Book standaard of de CD-text uitbreiding.
  • De opnameparameters voor digitaal geluid zijn vast gedefinieerd in de Red Book standaard: 16bit/44,1kHz/stereo Het WAV formaat laat toe deze parameters naar eigen goeddunken in te stellen. Wanneer men een geluidssignaal van hogere kwaliteit zou proberen opnemen op een audio-cd dan leidt dit onvermijdelijk tot kwaliteitsverlies. Het aanpassen van de parameters aan het signaal beperkt dit kwaliteitsverlies tot een minimum.
  • De Yellow Book standaard voor gegevenscd's kent twee foutopsporings- en correctiesystemen (CIRC en EDC/ECC) terwijl een audio-cd slechts 1 dergelijk correctiesysteem bezit (CIRC)
  • Naar de toekomst toe wordt het gebruik van binaire computerbestanden steeds belangrijker om data te gaan raadplegen. De data op een audio-cd dient men eerst nog om te zetten naar een computerbestand vooraleer men dit kan gaan aanbieden. Dit neemt de nodige tijd en rekenkracht in beslag. Wat betreft performantie is het dan ook interessanter om een geluidssignaal als een computerbestand op te slaan.

Tenslotte bestaat er ook een standaard voor het definiëren van een mappenstructuur, het toekennen van map- en bestandsnamen en het benoemen van de volume descriptor op een opslagmedium. Dit is de ISO-9660 standaard. cDAVID raadt aan om met het oog op uitwisselbaarheid en platformonafhankelijke dataopslag, de standaard te volgen.

Afkomstig van CDAVID NL, de Vrije Encyclopedie. "http://www.cdavid.be/index.php/Formaten_voor_audio"

image:antwerpen.jpg


image:leeuw.gif
Met steun van de Vlaamse minister van Cultuur, Jeugd, Sport en Brussel