On demand distributie van digitale afbeeldingen

Inleiding Proefopstelling Afbeeldingen Geluid
Besluit

Binnen het onderzoek rond on demand distributie vormen digitale afbeeldingen het onderwerp van een eerste casusstudie. We testen uit in welke mate het mogelijk is om on demand een raadplegingskopie te maken op basis van een archiefkopie.

Uitgangspunt

Gedigitaliseerde collectie op de server
Enlarge
Gedigitaliseerde collectie op de server

De server in onze opstelling doet dienst als centrale bewaarplaats voor de archiefkopieën. We kozen 11 reeds gedigitaliseerde beelden uit het beeldarchief van het Stadsarchief Antwerpen. Deze selectie omvat zowel gedigitaliseerde documenten als foto's en afbeeldingen in zwart-wit of in kleur. Met een dergelijke gedifferentieerde selectie hopen we een zekere representatie van een gedigitaliseerde collectie beeldmateriaal te kunnen vormen.

Dit zijn de relevante technische kenmerken van het gedigitaliseerde materiaal

  • Bestandsformaat: Baseline TIFF versie 6.0
  • Resolutie: 300dpi
  • Bitdiepte: 8 (grayscale) of 24bit
  • Geen enkele vorm van compressie toegepast

De verschillende factoren (afmetingen, resolutie, kleur/geen kleur,...) hebben ertoe geleid dat de archiefkopieën verschillen in grootte. Deze varieert van 24.208Kb tot 179.722Kb.

Deze digitale documenten worden bewaard in een folder op de server die niet rechtstreeks toegankelijk is voor publiek. Via Samba kunnen we deze selectie eenvoudig beheren (beelden toevoegen, verwijderen,...)

Uitwerking

Gedigitaliseerde collectie gepresenteerd via een webbrowser
Enlarge
Gedigitaliseerde collectie gepresenteerd via een webbrowser
Een on demand gegenereerde PNG afbeelding
Enlarge
Een on demand gegenereerde PNG afbeelding

Deze beelden wensen we via on demand creatie en distributie toegankelijk te maken voor de bezoeker via een webinterface. Voor de praktische uitwerking werd een beroep gedaan op volgende softwarepaketten:

  • PHP
  • imagemagick
    Dit is een set van programma's en programmabibliotheken voor beeldbewerking. ImageMagick is vrije software.
  • iMagick
    Dit pakket is een een PHP wrapper voor de ImageMagick functies.

Via een door cDAVID ontwikkeld PHP script wordt een lijst samengesteld van de digitale collectie. Deze lijst wordt gepresenteerd aan de bezoeker. Elke referentie naar een gedigitaliseerd stuk is een aanklikbare hyperlink. Wanneer een bezoeker een keuze maakt en een hyperlink aanklikt, dan worden volgende acties ondernomen:

  1. Het TIFF bestand wordt opgehaald uit de digitale collectie.
  2. Het PHP script leest de beelddata in het TIFF bestand in het geheugen van de server
  3. Het PHP script roept via imagick de conversiefuncties in de programmabibliotheek van imagemagick aan. Deze functies voeren volgende handelingen uit:
    • resamplen de beelddata naar een kleiner beeld met een lagere resolutie
    • conversie van de geresamplede beelddata naar een bestandsformaat met compressiemogelijkheden (bijvoorbeeld PNG of JPEG)
  4. De geconverteerde beelddata wordt weggeschreven naar een bestand op een publiek toegankelijke ruimte van de server. De oorspronkelijke bestandsnaam wordt daarbij opnieuw gebruikt.

De grootte van de on demand gecreëerde referentiekopie wordt in het script bepaald door de variabele width Dit is de breedte van de afbeelding. Wij hebben gekozen voor een grootte van 400 pixels.

Vaststellingen

Generatietijd tov grootte van een digitaal beeld
Enlarge
Generatietijd tov grootte van een digitaal beeld

Voor 9 van de 11 afbeeldingen is de gemiddelde tijd om een raadplegingskopie te genereren 8,92 seconden. De digitale afbeelding die het snelste werd omgezet (1,73 seconden) was een digitaal beeld van 2959 bij 2791 pixels (resolutie 300dpi) in kleur

In de 2 overige gevallen duurde dit echter respectievelijk 178,52 en 211,64 seconden. De laatste afbeelding had een omvang van 14266 bij 4301 pixels (resolutie 300dpi) en was in kleur. Deze resultaten werden genoteerd tijdens het afhandelen van slechts één HTTP verzoek door de Apache webserver.

In feite moet het systeem de beeldata integraal inlezen en verwerken om een bruikbare raadplegingskopie te bekomen. Samen met de hoeveelheid data stijgen ook de benodigde systeembronnen. Wanneer er meer data moet worden verwerkt dan er bronnen beschikbaar zijn, dan stijgt de verwerkingstijd exponentieel.

Het is duidelijk dat een goed uitgeruste machine een vereiste is voor een vlotte on demand creatie en distributie van afbeeldingen.


image:antwerpen.jpg


image:leeuw.gif
Met steun van de Vlaamse minister van Cultuur, Jeugd, Sport en Brussel