Nogal wat, volgens de experts. Om te beginnen, wat we denken dat permanent is, is dat niet. Digitale opslagsystemen kunnen binnen drie tot vijf jaar onleesbaar worden. Bibliothecarissen en archivarissen haasten zich om dingen naar nieuwere formaten te kopiëren. Maar entropie is er altijd, wachtend in de coulissen. „Onze beroepen en onze mensen proberen vaak de normale levensduur zo ver mogelijk te verlengen door middel van een verscheidenheid aan technieken, maar het houdt het tij nog steeds tegen“, zegt Joseph Janes, universitair hoofddocent aan de University of Washington Information School.
Om de zaken nog ingewikkelder te maken, worstelen archivarissen nu met een ongekende stortvloed aan informatie. In het verleden waren materialen schaars en opslagruimte beperkt. „Nu hebben we het tegenovergestelde probleem“, zegt Janes. „Alles wordt de hele tijd opgenomen.“
Dat zou in principe een historische fout kunnen rechtzetten. Eeuwenlang hadden talloze mensen niet de juiste cultuur, geslacht of sociaaleconomische klasse om hun kennis of werk te ontdekken, te waarderen of te bewaren. Maar de enorme schaal van de digitale wereld vormt nu een unieke uitdaging. Volgens een schatting van het marktonderzoeksbureau IDC vorig jaar zal de hoeveelheid data die bedrijven, overheden en individuen creëren in de komende jaren het dubbele zijn van alle digitale data die eerder zijn gegenereerd sinds het begin van het computertijdperk.
Hele scholen binnen sommige universiteiten werken aan het vinden van betere manieren om de gegevens onder hun paraplu op te slaan. Zo heeft het Data- en Servicecentrum voor Geesteswetenschappen van de Universiteit van Basel een softwareplatform genaamd Knora om niet alleen de vele soorten data uit het geesteswetenschappelijk werk te archiveren, maar ervoor te zorgen dat mensen ze in de toekomst kunnen lezen en gebruiken. En toch is het proces beladen.
„We kunnen niet alles redden… maar dat is geen reden om niet te doen wat we kunnen.“
Andrea Ogier
„Je maakt gefundeerde gissingen en hoopt op het beste, maar er zijn datasets die verloren gaan omdat niemand wist dat ze nuttig zouden zijn“, zegt Andrea Ogier, assistent-decaan en directeur dataservices bij de University Libraries of Virginia Tech.
Er zijn nooit genoeg mensen of geld om al het nodige werk te doen – en formaten veranderen en vermenigvuldigen zich voortdurend. “Hoe kunnen we middelen het beste toewijzen om dingen te behouden? Omdat de budgetten maar zo groot zijn”, zegt Janes. „In sommige gevallen betekent dit dat dingen worden opgeslagen of opgeslagen, maar daar gewoon blijven staan, niet gecatalogiseerd en onverwerkt, en dus bijna onmogelijk te vinden of te openen.“ In sommige gevallen wijzen archivarissen uiteindelijk nieuwe collecties af.
De formaten die worden gebruikt om gegevens op te slaan, zijn zelf vergankelijk. NASA heeft ongeveer 170 banden met gegevens over maanstof weggegooid, verzameld tijdens het Apollo-tijdperk. Toen onderzoekers halverwege de jaren 2000 de banden gingen gebruiken, konden ze niemand vinden met de IBM 729 Mark 5-machine uit de jaren 60 die nodig was om ze te lezen. Met hulp heeft het team er uiteindelijk een in ruwe staat opgespoord in het magazijn van het Australian Computer Museum. Vrijwilligers hielpen bij het opknappen van de machine.
Software heeft ook een houdbaarheidsdatum. Ogier herinnert zich dat hij probeerde een oud Quattro Pro-spreadsheetbestand te onderzoeken en ontdekte dat er geen direct beschikbare software was die het kon lezen.