Оригінальна пропозиція для всесвітньої мережі, написана Тімом Бернерсом-Лі в 1989 році, є важливою частиною історії Інтернету. Його також неможливо відкрити на сучасних комп’ютерах.
Джон Грем-Каммінг, британський програміст і письменник, намагався відкрити документ Word, що містить пропозицію. Сучасні версії Microsoft Word і Apple Pages повністю не змогли відкрити файл, сказав він у своєму блозі. Текстовий процесор з відкритим вихідним кодом LibreOffice працював, хоча й із безладним форматуванням. Грем-Каммінг нарешті знайшов PDF-файл, експортований CERN у 1998 році, і це був єдиний спосіб побачити документ у тому вигляді, в якому він існував у 1989 році.
Викликає занепокоєння те, що така важлива частина історії в такому загальному форматі файлу може бути майже повністю втрачена через час і оновлення програмного забезпечення. Кожен, хто має колекцію старих цифрових документів, фотографій і відео, може запитати, чи станеться те саме з їхніми архівами, а це питання, з яким постійно стикаються цифрові архівісти. Так я дістався до одного.
«Двадцять років у цифровій сфері — це давно», — каже Ленс Стачелл, директор служби цифрового збереження в Мічиганському університеті. Його команді часто доручають відновлення цифрових файлів зі старих комп’ютерів і носіїв інформації. «У нас є лабораторія, яка може працювати зі старими носіями — дискетами, компакт-дисками, старими комп’ютерами. Ми можемо зняти його з цих типів носіїв і передати в нашу систему обслуговування, при цьому переконавшись, що ми не зіпсуємо його під час цього».
Але видалення файлів з диска — це лише перший крок: далі їх потрібно відкрити та залишити в такому стані, коли вони залишатимуться відкритими десятиліттями вперед. Ця робота дала Штухелю привід думати про стратегії збереження документів якомога довше. Я запитав його, що повинні робити ті з нас, хто не є професійними архівістами, щоб зберегти свої записи за останні десятиліття.
Використовуйте відкриті формати
Документ Word, про який я згадував раніше, більше не можна було відкрити в Microsoft Word, оскільки програмне забезпечення з часом змінилося. Це частина складності архівування цифрових файлів.
«Щодо натуральних речей, чим менше ви на них дивитеся, тим довше вони тривають», — каже Стучелл. «Цифрові речі, ми постійно боремося із старінням. Коли файл рухається в часі, він втрачає інформацію».
Оновлення такого програмного забезпечення, як Microsoft Word, означає, що файли, які добре відкривалися у 80-х, не відкриватимуться у 2020-х. Частина проблеми: Microsoft, і тільки Microsoft, контролює формат файлу або навіть знає, як він працює. З цієї причини Штучелл каже, що він заохочує людей експортувати файли у відкритий формат файлів — особливо файли, які вони хочуть зберегти доступними протягом тривалого часу.
Для документів він рекомендує PDF/A, відкритий стандарт на основі формату PDF від Adobe, який містить усе, що потрібно для відкриття файлу, включно зі шрифтами, які використовуються в документі. Microsoft Office, LibreOffice і Adobe Acrobat підтримують експорт у PDF/A, що означає, що створити такий файл відносно легко. Stuchell рекомендує архівувати будь-який документ, який ви хочете зберегти, у цьому форматі.