電子報詳情頁

知見錄/脆弱的數字資源\胡一峰

偶然看到一則消息,有家媒體公司有上萬個九十年代用來存檔的硬盤驅動器,現在五分之一無法讀取,上面的資料可能全部遺失了。這很令人警覺。我曾下意識地認為資料數字化後就可以千年萬代保存下去。這種想法其實是想當然,簡單的生活經驗就可以證偽。我有好幾個損壞的U盤、硬盤和手機,裏面的文檔照片都無法讀取了。它們擺在我的抽屜裏,事實上毫無用處,沒有丟進垃圾桶,既因愛惜舊物的習慣,也怕個人信息丟失。

冗餘資料的數量與媒介方便程度似乎成正比,到了數字時代更是瘋狂增加。自打有了電腦寫作,修改文稿更加方便,修改次數也大大增加。每改一次都留下過程稿,曾被我視為一個好習慣,後來卻發現,就回溯修改過程而言,數字化的過程稿看似增刪清晰,實則不如手改稿直觀。每改必存毫無必要,反而製造了冗餘累贅。

據說,二○二○年全球產生數據量已經超過四十ZB,相當於地球上每個人每年產生了五TB的數據。其中,百分之八十以上是不經常使用的「冷數據」,但至少有百分之十的數據是有價值的數字資源,需要被長期保存。與傳統的紙張相比,數字介質的維護成本更大。由於格式和載體對環境的依賴性,數字資源其實十分脆弱,如何長期保存和保真都已成為全球課題。

其實,與此相關的另一話題同樣值得關注,那就是選擇。保存文化資源的目的是為了傳遞文明。歷史地看,每個時代都在為後世立法,其方式就是對本時代的文化進行選擇性保存。因此,研讀歷史不只是了解過去是個什麼樣子,更能搞懂如今為何是這般樣子。如果說,前信息時代的選擇性保存是受制於介質技術不得不為之「惡」,那麼,在新介質的加持下,今天更要避免因為選擇失誤或放棄選擇帶來的信息負擔之「惡」。

友情鏈接