Experti Norské národní knihovny již dvanáct let pracují na projektu, jehož úkolem je zdigitalizovat veškeré publikace, které v norské historii vznikly. Vedle knih, noviny, časopisů, plakátů, filmů, fotografií nebo map jde i o manuskripty, přepisy rozhlasového a televizního vysílání či o všechny webové stránky na doméně .no. Jejich práce zabere podle odhadu ještě dalších 30 let.
Aktuálně spravuje Norská národní knihovna ve svém archivu 540 tisíc knih a přes dva miliony novin. Všechny tištěné publikace postupně procházejí skenováním a převodem obrazu na text (OCR). Poté putují v elektronické a prohledávatelné podobě do digitálního úložiště. Letos v září v něm informatici knihovny spravovali kolekci dokumentů – knih a novin – o celkové velikosti 8,1 petabajtu.
Denně do digitálního úložiště přibude pět až deset terabajtů dat. A jejich bezpečným uložením práce informatiků v knihovně nekončí. Data, resp. dokumenty musejí rovněž zpřístupnit veřejnosti. A ani tento krok nepředstavuje poslední operaci, která digitalizované dokumenty provází. Problematickým se pro dlouhodobou archivaci ukazuje být také formátování. Knihovníci s převodem starších souborů do novějších formátů již udělali první zkušenost. Konverzí 50 milionů obrázků zaměstnali 10 serverů po dobu tří měsíců v režimu 24/7. A to byly soubory uloženy na pevných discích, nikoli na magnetických páscích. Knihovní informatici předpokládají, že konverze formátů proběhne několikrát za století.
Každý soubor existuje v digitální kolekci třikrát, jde o tzv. triplikáty. Jednou je uložen na pevném disku, dvě kopie sídlí na magnetických páscích. Ty spravuje řešení založené na systému Oracle SAM-FS. Nejde tedy o tradiční páskový zálohovací systém. Zálohy totiž knihovna v obvyklém smyslu tohoto slova nevyužívá. Nahrazuje je právě triplikáty. tj. třemi stejnými kopiemi. Tradiční zálohování, resp. případná obnova dat, by totiž zabrala neúměrně dlouhý čas.