可能是这个星球上最奢侈的数字宝库,没有之一的,是哈佛大学的电子图书馆。当你坐在家中轻点鼠标,就能看到14世纪手抄本的每一道笔触。并且能看到晚清中国的每一粒尘埃。这种跨越时空的“上帝视角”完全免费。这种幸福感确实难以形容。
藏在数字背后的文明抢救
哈佛开展馆藏资料的数字化工程,起始于20多年之前。在1990年代末期,那时互联网才刚开始普及,哈佛察觉到胶片会老化,纸张会发脆,只有数字化能够让珍贵资料得以永存。他们从最为脆弱的玻璃底片以及手稿着手进行扫描,第一批数字化的对象里就含有大量19世纪的中国影像。
至今这场抢救行动依旧在持续进行着,于哈佛的数字实验室当中,工程师以及古籍修复师一同开展工作,借助超高精度扫描仪逐页去拍摄那些不能够通过手工翻阅的破损书籍,每一页的扫描时间常常要达到数小时之久,仅仅是为了捕获纸张纹理以及墨迹渗透的细节。
二十九个数据库的震撼
当下,哈佛面向公众开放的数据库数量多达29个,其覆盖范围包含了从欧洲中世纪一直到远东文明的各个方面。于杜德维的相册之中,你能够看到1905年那会儿福州盲童学校的美国女教师是怎样开展授课的;在Morrison的镜头之下,1930年代北京的街头小贩的表情鲜活如同当初一般。
无比令人惊叹的是那些跨越领域的数据库,在14世纪的拉丁文圣经旁边,极有可能就是乾隆时期的罗汉像拓片,明治时期日本茶室里的和风静物一旁,却是晚清邮政地图纷繁微细的线条汇聚,这般文明之间的对话并不需要机票,仅仅只需一根网线就可以达成。
像素背后的学术伦理
哈佛数字化的标准十分严苛,普通浏览所用的图片,已然达到300dpi分辨率,而研究者专用的TIFF格式原图,更是超过600dpi,就连纸张上的水印以及修补痕迹,皆呈现得清清楚楚,这种清晰度使得全球范围内的学者,不必亲临波士顿,便可开展一流的研究工作。
更为难得的是,对于版权持有开放的态度。但凡属于无版权争议的公有领域资料,哈佛都会准许自由下载,亦会准许出版,甚至还会准许商用。他们摒弃运用技术手段加锁,摒弃在图片之上布满水印,这般学术共享的风范,令诸多商业数据库自愧不如。
跨越太平洋的合作
哈佛燕京图书馆跟中国国家图书馆的合作,那真可谓是典范。正在搞建设的中文善本特藏资源库,有着这样的计划,要收录4210种古籍,数量超过5万卷。那些原本一直深藏在库房里的宋元刻本,在未来将会朝着所有人张开怀抱。
合作并非仅仅局限于技术扫描,两馆的专家一同制定数字化标准,一同撰写著录条目,甚至一同研究那些难以辨别的藏书印章。在2015年底项目达成之时,全球的汉学研究者都能够获取这份厚重的礼物。
从哈佛到你的书房
动用这些资源容易到令人难以相信地步,不必进行注册,不用拥有校园账号,径直登录哈佛图书馆官网便可进入各个数据库,你能够于北京下载晚清海关官员的家庭相册,也能够在纽约乡村查看欧洲修士的祈祷书。
唯独所需的乃耐心与好奇心,面对数量众多的资料,好多人反倒不知从哪里开始看起,实际上最佳的办法便是随机浏览,从一幅地图起始,从一张老照片起始,让好奇心引领着你于历史里漫游。
免费午餐还能吃多久
数字化的成本高昂到令人震惊的地步,一个中型项目就需要花费数百万美元,存储以及维护费用更是像没有尽头不能填满的洞穴,哈佛之所以持续坚持免费开放,依靠的是数额巨大的捐赠基金以及学术传统的支持。
然而,危机正于悄然之中渐渐来临,伴随版权法愈发严格苛刻,诸多20世纪的资料因版权情况不明难以实现开放,与此同时,商业数据库正以疯狂之势收购数字资源,未来的学者极有可能要为当下免费存在的内容支付高昂到天价的费用。
面对着这般不存在墙壁的珍宝馆,你最先想要开启哪一个数据库?是属于晚清时期的中国影像,还是欧洲中世纪的手稿?在评论区域告知我你的抉择,使得更多的人能够去分享这些文明的片段。






