互联网档案馆
出自 MBA智库百科(https://wiki.mbalib.com/)
互联网档案馆(The Internet Archive)
目录 |
互联网档案馆(The Internet Archive)自1996年成立起,The Internet Archive定期收录并永久保存全球网站上可以抓取的信息。
由Alexa创始人布鲁斯特·卡利(Brewster Kahle)创办,是一个Wayback machine公益性质的计划。Internet Archive 非正式中文名有“网站时光倒流机器”、“互联网档案馆”等。对于不同的网站,其收录的网页数量和收集周期也不相同,一些大型网站可能每天都会被“备份”一次,每次可能收录数十个以上的网页,而一些小型网站可能每年收录几次,每次只有几个网页。对网站不同时期的历史资料进行研究,是互联网档案馆最大的价值所在。用户可以通过Internet Archive的“Take Me Back”对网站的发展与历史资料进行研究。
创立之初的宗旨是保存数字化知识中的历史文化瑰宝,并对所有用户提供免费的无差别访问,帮助各国研究者进行研究。目前拥有3个数据中心,分别坐落于美国旧金山、红木城和里士满市。此外,在埃及的亚历山大图书馆和荷兰阿姆斯特丹也设立了数据存储设施。其数据是由自带的网络爬虫自动搜集的,其网站典藏档案馆网站时光机,抓取了超过1500亿的网页。
“互联网档案计划”分为六大部分:
一、电子书
它专门收集公共领域的书籍和文档,利用者都可以免费下载。截至到今天,共有29万多种材料,堪称互联网上最好的公共领域图书搜索引擎。通过这一平台为公众查询和利用文献资料提供了便捷的途径和开放性的平台,更便于知识的传播和利用。体现出信息化时代档案资料的共享性。它主要收集英语书籍,但也包括少部分其他语种的书籍,比如朱熹的《论语集注》。
二、网页
这个部分有个专门的名字,叫做”时光倒流机器“(Wayback Machine),它像收集旧报纸那样收集旧网页。举例来说,Yahoo!的首页就有5000多份档案,最早的可以回溯到1996年10月17日,最近的则是2007年8月30日。根据2006年的统计,当时Wayback Machine的存储容量有2000TB,然后还在以每月20TB的速度增加。
三、视频
这个部分收集视频材料,可以在其中找到动画片和电影。通过年份的划分,方便利用者更加快捷地查找资料,在查找,下载视频的过程中,慢慢找到当时的记忆,视频相当于一个载体一样,不仅仅承载这视频资料,更代表着视频所在年代的人文风情,是宝贵的档案资源。
四、音频
音频材料主要是有声书籍和音乐。收录有声书籍和音乐,保留不同载体的档案资源,大大丰富了原始档案馆保存档案的形式。并且弥补了关于声音档案网站有所缺失的现状,声音档案由于其载体的特殊性,再加上收录不便,对于声音档案的关注度没有实物档案一样,互联网档案馆的建设,对声音档案的关注也有利于声音档案的发展和保护。
五、软件
互联网档案馆对软件的收集扩展事项也和不少软件公司以及独立档案项目达成合作,其中包括 Shareware CD Archive、TOSEC archive、FTP site boneyard、Disk Drives。收集的软件涵盖了共享软件、免费软件、软件视频宣传和开源软件,经典 PC 游戏、游戏补丁等。除此之外,该档案馆也将一些相关文件编制也收藏其中,例如 Apple I 的说明书。
六、教育材料
这部分主要是收集美国大学课程,有视频和文字材料下载,相当于不去北美就可以上那里的课,比如麻省理工学院的《微分方程》和Naropa大学的《艾伦·金斯堡的诗歌》。突破了时间和空间上的限制,减少了知识流通过程中遇到的阻碍。使知识更加面向大众,而不仅仅是惠及一小部分的人,这也是互联网档案馆的一个压倒性优势,也是档案数字化高度发展的一个体现。
一、提高了经济效益,大大减少了保管费用和占地空间。将许多以纸质为载体的档案信息转化为嫉妒档案极大地减少了保管储存的费用也避免了因反复印刷而造成的纸张浪费。
二、提升了效率,能提供详细及时的数据信息,使查询资料变得方便快捷。
三、提供全面的服务工作,互联网档案馆提高了档案管理水平,有利于档案面向社会、服务大众,提供了更加全面的服务工作。
四、实现更高的社会价值。档案自身的重要性,决定了其具有的社会价值,但也绝对是社会历史发展过程中一个不可或缺的方面,承载过去又为现在所利用。能够使我们更好地规划未来互联网档案馆的建设,涉及不同的领域和行业传承人类文明。为社会主义政治经济建设,推动各项事业的发展起着重要的作用。总而言之,互联网档案馆的建设是顺应时代潮流,紧跟时代发展的新举措,有利于进一步推动档案管理事业的发展,加快社会进步和人类文明进步的步伐。
TS档案学人.《互联网档案馆》.与档同行.2019-03-24


