数字学术视角下的人文数据库出版
国家图书馆出版社,100034,北京
编委: 苏磊
关键词:
本文引用格式
王涛.
伴随着数字人文概念的兴起,数字学术(Dightal Scholarship,简称DS)概念出现并成为学术界和图书馆界一个新的关注点,数字学术对于学术出版而言,是一个值得深入研究的问题。相比而言,数字人文偏重于研究本身,数字学术强调新的环境下传统学术环境的进化与发展,作为学术交流重要环节之一的出版,必然会受到这种进化带来的冲击与挑战,在数字人文与数字学术不断发展的情况下,也必须对原有的出版形式、内容、手段等进行创新,才能满足学术的需要。
1 数字学术的定义
相比数字人文,数字学术在国内讨论的较少,但是在国外数字学术已经是一个相对成熟的概念,目前出现在以数字学术实验室、数字学术中心命名的机构,其中,图书馆在数字学术中扮演了重要的角色。2016年,研究图书馆协会(The Association of Research Libraries,以下简称ARL)发布了题为《SPEC Kit 350: Supporting Digital Scholarship》[1]的报告,这标志着数字学术不仅仅停留在一个学术概念的范畴,而是已经被应用到具体的实践当中。2016年ARL面向其124个成员馆进行了关于图书馆支持数字学术的调查,收到73所ARL成员馆的调查反馈。调查结果显示,高校图书馆是支持数字学术实践的主要团体。
Wiki对数字学术定义是:“利用数字证据、调查、研究、出版和保存方法实现学术和研究目标。”研究图书馆学会及国际图联(IFLA)对于数字学术采用了Abby Rumsey的定义。Abby Rumsey是基于学术交流(scholarly communication)的角度对学术进行定义的,它基于学术是创作、出版、管理、使用学术成果的认识,将数字学术定义为:“数字证据和方法的使用,数字创作、数字出版、数字化管理和保存以及数字化利用和复用学术成果。”[3]这也是目前被引用最广泛的一个定义。
数学学术强调,使用数字媒体进行学术交流和研究数字媒体,目的是将数字媒体和社交媒体作为学术研究中可靠、专业和正式的研究和交流手段。数字学术涉及了学术交流的各个过程,不局限于学者,数字学术更加侧重的是学术成果的生产和传播问题,探讨版权、合理使用、数字版权管理等能够影响学术交流的因素。数字学术的提出,目的是为了构建一个新的学术交流模式,学术交流的目标并没有发生改变,改变的是交流手段和观念,这将为学术带来分析方法、学术呈现方式、研究范式以新的可能性。新的交流模式意味着基于传统学术模式的各类学会、图书馆、档案馆、博物馆以及其他基于纸质出版商业模式出版者都因为这场变革而发生根本性的变化。数字学术力图构建一个适应数字时代的学术交流模式。Abby Rumsey认为,在新的模式构建过程中,关键角色包括学者、图书馆、管理者以及涉及学术交流的各类专业人员,要求学者能够扩展科学领域,进行跨学科合作,利用技术进行学术创新;图书馆要能够支持各类型资料的获取,保证学术资料的长期保存及获取;管理者能够按照新的模式对资源进行重新分配,以促进新的学术模式的发展;涉及学术交流的各类专业人员要根据新的学术交流模式规划项目,并根据原有的运行方式、机制及职业规划进行创新。
2 数字学术与数字人文的关系
数字学术与数字人文的关系在Wiki中被表述为紧密的关系,但是对于二者的具体关系没有明确,而在图书馆界,对于数字学术与数字人文的关系表述得非常明确。在《SPEC Kit 350》报告中,直接指明了数字学术与数字人文的关系。2011年的ARL的报告《SPEC Kit 326: Digital Humanities》将数字人文定义为“一个采用计算机技术的新兴领域,旨在探索人文学科的新研究领域。数字人文学科的从业者不仅要吸收与人文科学相关的传统写作和研究技能,还要学习技术技能和基础设施”。[4]时隔4年之后的《SPEC Kit 350》指出,原有的数字人文已经无法很好地覆盖当前的需要,需要将数字人文的外延进一步扩大,将数字学术视为对于数字人文的方法、手段、学科的扩展。学术图书馆深刻地感受到了自身在学术环境发生变化中所面对的危机,因此正在积极转变成为一个服务平台(Library Services Platform,简称ISP),从人员配置、服务模式方面等适应数字人文的需要。
就目前的实践来看,数字学术与数字人文的关系密切,很多“数字学术中心”设置在人文学科之内,图书馆提供的数字学术服务主要对象是人文学科,但二者并不是简单的扩展关系。
数字人文关注的是研究自身,研究者以人文学者为主,目的是利用数字技术扩展新的人文学科视野,而数字学术焦点则在于建立新的学术交流模式。数字人文涉及的内容可以视为数字学术的一部分,即数字学术中的“数字证据和方法的使用,数字创作”。数字学术从更高的层次促进学术的整体发展,包括但并不限定于人文科学,它涉及的参与者也不仅仅包括各个学科的研究者,还有各类图书馆、博物馆、档案馆、学术出版商以及数字技术公司等,相较于数字人文关注具体的研究手段、方法、范式,数字学术更加侧重宏观的学术制度设计、学术伦理、知识产权等内容,因此二者并不在一个层级当中。数字学术与数字人文是相互促进的:数字学术对于知识产权、科学评价体系、开放获取等的研究,会使数字人文获得更加有利的发展环境;而数字人文会在遇到各类问题时试图解决,这就会丰富数字学术的实践,为数字学术提供更多的实例与经验,验证新的学术交流模式,从而促进数字学术的发展。
3 学术出版在数字时代面临的困境
西方学者按照信息传递记录的方式将学术交流划分为3个时代:抄写时代、印刷时代、数字传播时代。现代学术繁荣是在15世纪古登堡发明了铅活字之后,人类传播能力有了革命性的突破,正是在这一时期,学术出版成为学术交流中重要的一环,之后出现的版权制度最终确定了学术出版的商业模式,并使其延续至今,学术出版在促进学术交流中功不可没。
但学术出版商业模式到了数字传播时代正在受到越来越多的诟病,学者们对于学术出版的商业模式提出严厉的批评,在某些激进的看法中,商业性的学术出版已经成为学术交流的阻碍。在对学术出版批评方面,最具有代表性的是Sci-Hub,Sci-Hub是一个免费提供学术论文的网站,建立于2011年。Sci-Hub宣称它能有效地绕过任何付费墙和限制,其累计提供的论文数量超过7 000万份,每天提供数十万份研究论文。在Sci-Hub的网站上醒目提出:
“我们在全球范围内对抗知识获取方面的不平等。无论收入、社会地位、地理位置等如何,都应该为每个人提供科学知识。我们的使命是消除阻碍人类社会最广泛分布的知识障碍!我们主张取消科学和教育资源的知识产权或版权法,版权法使大多数在线图书馆非法运作,因此,许多人被剥夺了知识,同时允许权利人从中获得巨大利益。版权增加了信息和经济的不平等性。”[5]
Sci-Hub提出的观点很有代表性,那就是学术共有,学术成果是一种社会公共产品,是造福整个社会的,而出版商却借用公有产品进行牟利。相对温和一些的表达,是将付费出版学术成果定义为一种“礼物经济”(gift economy)——为了发表,就需要赠送gift(版权和资助),这与强行收取“过路费”的行径没有什么区别。让学者更加难以接受的是,自己在付出代价的同时,传播的效果并没有达到最好,收费的模式阻挡了很多真正需要但是没有付费的人。除了原有的期刊专著受到批评,对学术数据库的批评也是不绝于耳,学术数据库费用高昂,且每年增长,过高的使用费用导致一些经费较为充足的著名大学图书馆都出现过因价格过高而停止订阅的情况;学术数据库采用整库销售(wholeslae)的方式,要么全部,要么一本没有,没有更加灵活的方式;学术数据库采用各类不同技术,相互之间缺乏有效的标准,制造出一个个信息孤岛,使得要获取完整信息就需要掌握各个数据库不同的使用技巧;由于缺少有效的信息分享,同类数据库中有着大量的重复内容,既浪费了有效的资源,又给获取信息带来了难度。学术出版进入了数字出版时代后变得水土不服,一个运转了几百年的模式为何学者变得越来越难以接受?这是数字学术所需要解决的问题,这是传统学术交流模式与当前需求之间冲突的体现。
4 从传播的角度看待学术出版出现的问题
学术界与出版商的矛盾由来已久,在学术出版的商业模式确立之初就已经存在,只是目前这个矛盾随着信息技术的发展变得更加突出:学者发现在一个信息发布成本几乎为零的自媒体时代,自己出版成果却依然如此艰难,同时在利用他人成果时受到种种制约,没有享受信息技术发展带来的红利,进而对于学术出版的作用质疑。相比大众出版,学术出版的商业模式在形式上让学者难以接受,学术成果被出版商无偿地作为商品使用,甚至还要支付一笔费用。但是从传播的角度,这个向作者收费的模式并没有多少不合理之处。传播本身就是成本,如果忽视这一点就很容易得到似是而非的结论。广告的商业模式与学术出版之间的差距并不大,但是广告却没有受到学术出版这么多批评,原因更多地在于广告主与广告商之间是一种付费获取收益的行为,广告商可以按照广告主的意愿将信息进行传播。如果将学术出版视为某种广告,为了推广自己的成果的学者视为广告主,那么向作者收费的合理性就会增强。学术出版现有模式的问题在于,与广告不同,学术出版的收费是双向的,而广告的收费是单向,双向收费的模式会影响传播的效果,学者的目的是尽可能传递到每个人,出版商却只将成果传递给那一部分付费的人,二者并不一致。造成这种不一致的原因是支付的费用不足以支撑传播的成本,因此学术出版只能够将其传播给最需要的人即愿意支付费用的人,这种稀缺性在经济学上是合理的。
很多人强调,学术成果是公共产品,因此应当免费,但学术成果的出版对于作者并不是没有收益的,只是这种收益是长期、隐形、难以衡量和计算的,更多地表现为学术认可、声望、成果所有权。即使学术成果是公共产品,但是传播是有成本的,传播并不天然具有公共产品的属性。
学术出版除了传播学术成果之外,对于学术的贡献之一在于质量过滤,确保了优质的资源才能出版,这在信息过载的今天尤其具有价值;另外一个贡献在于为学术评价提供了相对客观和可以计量的依据,期刊的质量在某种程度代表了论文的质量,这也是核心期刊为何在学术评价中如此重要的原因。
综上所述,将学术出版视为学术交流的障碍是片面的,学术出版依然是学术交流中重要的部分,但是传统的学术出版确实越来越不能适应当前学术交流的发展。由印刷时代发展到数字出版时代,尤其是在信息获取、处理、发布成本大幅度降低的今天,学术出版提供的服务无论是成本上还是效率上并不能让学者满意,一些学术出版社甚至反而利用自身的垄断地位保证自身的商业利益,这某种程度上伤害了学术的发展,也动摇了自己在学术中的地位,因此学术出版必须做出改变。
5 开放是未来人文数据库建设的关键
Martin Weller认为数字、网络化、开放(digital, networked and open)是数字学术关键的三要素,[6]在学术出版基本商业逻辑不改变的前提下,要建立适应数字学术的新模式就要这三个要素入手,个人认为开放是学术出版未来发展成功的关键。下面探讨人文数据库在未来数字学术模式中的形态。
1)数字学术要求人文数据库能够具有更加广泛的“合理使用”范围
学者出版是为了最大范围地传播其成果,但学术出版目前还只能将其传播给付费的用户,这也是目前最为突出的矛盾。版权制度是现有出版业商业模式的基石,作为一种知识产权制度,必须在社会需要与保护利益方面进行一定的妥协,“合理使用”可以看作是对于知识产权的某种制约或救济,防止知识产权的滥用。而未来学术出版,必须建立一种新的救济制度,才能保证不会过于强调自身的利益而损害学术的发展。开放是未来这种救济制度重要的方面,通过开放来平衡商业利益与社会责任,更好地促进而不是损害学术的发展。这种救济制度使得在不损害根本利益的前提下能够满足学者需要。从目前来看,由于数字传播成本较之传统纸质出版大幅度降低,数据库传播信息的边际成本几乎为零,这就为进一步扩大学术合理使用提供了可能性。利用网络身份识别技术,数据库可以有效地区分每个用户,可以为非付费用户提供一定额度的免费使用量,满足其小规模使用的需要而不会影响到其商业收益,同时可以扩大作者成果的影响力,这对于促进整个学术交流将具有积极意义。
2)人文数据库进一步开放数据
在目前的人文数据库领域出现了非常奇怪的现象,商业学术数据库在创新性、开放性方面远远落后于非商业的学术书库,尤其是开放性。为了保证自己的特色和防止盗版,商业人文数据库可以用封闭来形容,水印、登录、限制IP、限制并发、限制浏览量、限制访问次数、限制复制次数或禁止下载,即便是最基本的书目也会加以限制。如果说这些带来的仅仅是使用上的不便的话,那么由于各个数据库之间没有统一的标准和数据交换格式而导致的数据库系统之间无法进行互操作,则是在一个推崇数字人文的时代让人难以忍受的。
随着数字人文的兴起,研究者发现研究缺少必要的数据支持,虽然数字化的材料迅速增加,但这些材料重复无序,各个系统之间缺乏统一的标准,系统也不支持数据的开放与互操作,给数字人文的发展带来阻碍。鉴于此种情况,包弼德提出构建“中国研究的网络基础设施”的设想:“上海图书馆、浙江大学图书馆、国家图书馆、北京大学图书馆,还有日本、欧洲和美国的图书馆开发一个通用的平台,作为中国研究的网络基础设施。它将建立在超星发现平台上,还将建设第三方数据的提交和分享功能、中国数字人文研究维基平台(通过开源的维基接口自动更新内容)以及其他分析工具,为第三方数据、第三方工具、第三方图书馆定制免费公开的访问元数据以及分享数据的规范和方案。此平台将支持用户浏览历史的记录和展示、用户自定义搜索域、第三方专业数据库的开放接口和配套方案、用户手动收集的数据库和3D数据过滤……为用户提供一键式的跨数据库学术资料检索服务,支持用户通过一次点击就能浏览、访问。该平台还将收集和分析用户交互数据,深入分析和展示用户的学术”。[7]从上述的表述中可以看到,学界对于人文数据库的需要更多地体现为数据之间的关联和分享,商业人文数据库如果不能在各个层次之间开放数据,那么会将自己孤立在网络基础设施之外。在一个万物互联的数字时代,孤立只能有一个没有未来的结局。
在构建未来的数字学术模式中,数字、网络化与开放是核心要素,这也应成为学术出版者关注的问题。学术出版应更多地将视角放在整个的学术交流环境中,根据未来的需求及时应变,否则将会在一个日益变化的学术环境中遭遇越来越多的困境。
参考文献
Supporting Digital Scholarship
[R].
New-Model Scholarly Communication: Road Map for Change
[EB/OL] [
/
| 〈 |
|
〉 |
