互聯網檔案館
出自 MBA智库百科(https://wiki.mbalib.com/)
互聯網檔案館(The Internet Archive)
目錄 |
互聯網檔案館(The Internet Archive)自1996年成立起,The Internet Archive定期收錄並永久保存全球網站上可以抓取的信息。
由Alexa創始人布魯斯特·卡利(Brewster Kahle)創辦,是一個Wayback machine公益性質的計劃。Internet Archive 非正式中文名有“網站時光倒流機器”、“互聯網檔案館”等。對於不同的網站,其收錄的網頁數量和收集周期也不相同,一些大型網站可能每天都會被“備份”一次,每次可能收錄數十個以上的網頁,而一些小型網站可能每年收錄幾次,每次只有幾個網頁。對網站不同時期的歷史資料進行研究,是互聯網檔案館最大的價值所在。用戶可以通過Internet Archive的“Take Me Back”對網站的發展與歷史資料進行研究。
創立之初的宗旨是保存數字化知識中的歷史文化瑰寶,並對所有用戶提供免費的無差別訪問,幫助各國研究者進行研究。目前擁有3個數據中心,分別坐落於美國舊金山、紅木城和里士滿市。此外,在埃及的亞歷山大圖書館和荷蘭阿姆斯特丹也設立了數據存儲設施。其數據是由自帶的網路爬蟲自動搜集的,其網站典藏檔案館網站時光機,抓取了超過1500億的網頁。
“互聯網檔案計劃”分為六大部分:
一、電子書
它專門收集公共領域的書籍和文檔,利用者都可以免費下載。截至到今天,共有29萬多種材料,堪稱互聯網上最好的公共領域圖書搜索引擎。通過這一平臺為公眾查詢和利用文獻資料提供了便捷的途徑和開放性的平臺,更便於知識的傳播和利用。體現出信息化時代檔案資料的共用性。它主要收集英語書籍,但也包括少部分其他語種的書籍,比如朱熹的《論語集註》。
二、網頁
這個部分有個專門的名字,叫做”時光倒流機器“(Wayback Machine),它像收集舊報紙那樣收集舊網頁。舉例來說,Yahoo!的首頁就有5000多份檔案,最早的可以回溯到1996年10月17日,最近的則是2007年8月30日。根據2006年的統計,當時Wayback Machine的存儲容量有2000TB,然後還在以每月20TB的速度增加。
三、視頻
這個部分收集視頻材料,可以在其中找到動畫片和電影。通過年份的劃分,方便利用者更加快捷地查找資料,在查找,下載視頻的過程中,慢慢找到當時的記憶,視頻相當於一個載體一樣,不僅僅承載這視頻資料,更代表著視頻所在年代的人文風情,是寶貴的檔案資源。
四、音頻
音頻材料主要是有聲書籍和音樂。收錄有聲書籍和音樂,保留不同載體的檔案資源,大大豐富了原始檔案館保存檔案的形式。並且彌補了關於聲音檔案網站有所缺失的現狀,聲音檔案由於其載體的特殊性,再加上收錄不便,對於聲音檔案的關註度沒有實物檔案一樣,互聯網檔案館的建設,對聲音檔案的關註也有利於聲音檔案的發展和保護。
五、軟體
互聯網檔案館對軟體的收集擴展事項也和不少軟體公司以及獨立檔案項目達成合作,其中包括 Shareware CD Archive、TOSEC archive、FTP site boneyard、Disk Drives。收集的軟體涵蓋了共用軟體、免費軟體、軟體視頻宣傳和開源軟體,經典 PC 游戲、游戲補丁等。除此之外,該檔案館也將一些相關文件編製也收藏其中,例如 Apple I 的說明書。
六、教育材料
這部分主要是收集美國大學課程,有視頻和文字材料下載,相當於不去北美就可以上那裡的課,比如麻省理工學院的《微分方程》和Naropa大學的《艾倫·金斯堡的詩歌》。突破了時間和空間上的限制,減少了知識流通過程中遇到的阻礙。使知識更加面向大眾,而不僅僅是惠及一小部分的人,這也是互聯網檔案館的一個壓倒性優勢,也是檔案數字化高度發展的一個體現。
一、提高了經濟效益,大大減少了保管費用和占地空間。將許多以紙質為載體的檔案信息轉化為嫉妒檔案極大地減少了保管儲存的費用也避免了因反覆印刷而造成的紙張浪費。
二、提升了效率,能提供詳細及時的數據信息,使查詢資料變得方便快捷。
三、提供全面的服務工作,互聯網檔案館提高了檔案管理水平,有利於檔案面向社會、服務大眾,提供了更加全面的服務工作。
四、實現更高的社會價值。檔案自身的重要性,決定了其具有的社會價值,但也絕對是社會歷史發展過程中一個不可或缺的方面,承載過去又為現在所利用。能夠使我們更好地規劃未來互聯網檔案館的建設,涉及不同的領域和行業傳承人類文明。為社會主義政治經濟建設,推動各項事業的發展起著重要的作用。總而言之,互聯網檔案館的建設是順應時代潮流,緊跟時代發展的新舉措,有利於進一步推動檔案管理事業的發展,加快社會進步和人類文明進步的步伐。
TS檔案學人.《互聯網檔案館》.與檔同行.2019-03-24


