知识生产视域下的科学数据出版实践
——兼论学术出版商的角色定位与功能分析
关键词:
本文引用格式
陈铭.
数字化技术和科研信息化的蓬勃发展带来了新型科研仪器和研究方法以及前所未有的科学数据浪潮,激发公共部门和社会公众对科学发现和创新的憧憬。科研人员不仅可以通过记录、分析数据解决以往看似不可攻破的科学难题,还可将数据作为新的研究对象,以数据为中心设计和开展科研活动。[1]如今,基于数字化技术、借助数据开展研究逐渐成为科学知识生产新的现实,科学数据也因其蕴含的独特价值成为独立于期刊论文的重要出版对象。
目前,科学数据出版被视为规范数据使用、提高数据质量、推动数据共享最有效的方式之一。但科学数据之于出版远非工作对象由“论文”变成“数据”的简单替换,而是对出版这一知识生产活动造成了全方位的影响,包括知识生产要素、结构、主体、机制和理念实践等,给学术出版商带来了一系列挑战。如何系统分析科学数据出版呈现的特征以及出版商的角色定位与功能,并借助这种理解达成对以科学数据为中心的知识生产实践的客观认识,是梳理“数据密集型时代”发展规律和引导科学数据出版实践的重要前提。加之科学数据出版尚处于发展初期,出版商等实践者亟须理论上的指导。为此,本文借助知识生产理论的广阔视野,结合科技出版的特点,考察和提炼科学数据出版的实践特征,并根据出版商的实际表现阐述其所发挥的独特作用,以期为相关研究和实践提供一个新的分析视角。
1 知识生产的经典解释范式
知识生产是人类在进行物质生产的过程中发现和创造各种为物质运动的转化提供条件与能量来源的思想、观点、方法和技巧等的过程。[2]19世纪初,柏林洪堡大学创始者威廉·冯·洪堡(Wilhelm von Humboldt)提出“由科学而达至修养”的观点,将“纯粹的科学研究”确立为早期知识生产范式。这种纯科学一般是发自科学家内心的求知欲,不考虑实际应用价值,只对纯知识和纯学理进行探索和研究。随着社会及信息技术的发展,尤其在20世纪80年代之后,知识生产迈入快速变革和转型的时期,以学科为中心、具有稳固组织界限、象牙塔式的知识生产模式已无法适应国家和社会发展的需求,知识生产开始呈现跨学科、多主体合作、以社会问题为导向等新的趋势。这些趋势不断积累、增强和作用,逐渐推动知识生产新模式的形成(见图1)。科学界一直密切关注知识生产的变革态势,并不断提出新理论探讨和区分知识生产在不同阶段的特征。[3]其中,比较具有代表性的理论包括大科学、后学院科学、新型知识生产模式2,为知识生产变革提供了解释力较强的说明和洞见。
图1
1.1 “小科学”和“大科学”
20世纪60年代,科学史专家德里克·J.德索拉·普莱斯(Derek J. de Solla Price)指出知识生产方式和科学结构正在由“小科学”向“大科学”过渡。[4]Price认为,小科学指的是由科研人员个人或小型研究团体独立进行的科研活动,多集中在单学科领域开展,通常不考虑实用价值,旨在追求科学真理和认识世界。类似观点还有马克斯·韦伯(Max Weber)提出的“学术群体所从事的事业不涉及终极关怀,不过问价值,更不应卷入政治”[5]。为了和“小科学”进行区分,Price用“大科学”来概括二战之后知识生产的转变。他认为科学已经变成一个规模巨大的社会性系统工程,政府通过资金赞助使科学参与到政府的开发项目中,以应对国家和社会发展过程中遇到的复杂性问题。大科学具有与小科学完全不同的特点:一方面,社会复杂问题的解决需要跨学科、异质性知识,研究难度大大增加,科学家难以独自完成复杂研究任务,科研活动需要大型科学团体共同完成;另一方面,知识生产辐射更宽广的范围,从“以个人追求科学真理为导向”转变为“以国家、社会需求为导向”[6],科学因此具有组织规模巨大、需要较多人财物支持、科研机构与社会主体紧密联系等特征。随着科学的发展规模日益扩大,社会功能日益增强,作为知识生产重要场所的大学也不再是修道院式的象牙塔,而是成为国家和社会的服务站。[7]
1.2 “学院科学”和“后学院科学”
科学哲学家约翰·齐曼(John Ziman)则是在即将迈入21世纪之际,提出后学院科学理论来描述科学知识生产现代转型的新趋势,并与此前的学院科学进行区分。[8]Ziman认为,学院科学是一种出于科学家个人爱好、小规模、非组织化的知识生产方式,其特征可概括为“CUDOS”,即公有性(communalism)、普遍主义(universalism)、无私利性(disinterestedness)、独创性(originity)、有组织的怀疑(skepticism)。[9]后学院科学则是学院科学在应用语境下向产业界的延伸,是一种受市场规则影响、与社会实践网络相互关联的新知识生产模式。[10]根据Ziman的观点,从学院科学到后学院科学的转变有一系列普遍的趋势,包括场所多元化、接受公众监督、知识效用性增强、跨学科和专业化、政治化等。[11]在后学院科学中,科研活动变成一个涉及不同类型组织的大型跨学科合作网络,研究成果面向公众的开放程度大大提升。并且,随着科学研究对社会发展的效用不断增加,社会各界和政府部门不断加大对科研活动的资金投入和指导力度,使科研越来越受到各种行政规范和制度标准的约束。
1.3 “模式1”和“模式2”
1994年,英国学者迈克尔·吉本斯(Michael Gibbons)等人指出,在人们熟知的传统知识生产模式之外,一种新型知识生产模式正在浮现,可划分为“模式1”和“模式2”。模式1指的是在社会实际之外进行高度抽象化的科学研究,是一种学科内部的、等级制的、刻板的知识生产模式,必须遵循一系列标准。而模式2是在社会应用情境中开展科学研究,指的是一种跨学科的、非制度化的、由异质性主体参与的、受多重标准检验的知识生产模式。[12]根据Gibbons的观点,模式1和模式2之间存在明显的差异:首先,模式1注重认知情境下科研范式与知识内在结构之间的逻辑关系,模式2则更强调以问题为导向,以及知识在应用和实践领域的效能,政府部门、企业等主体所面临的实际问题都有望成为科学研究的起点。其次,相较模式1的只在单一学科框架内开展研究,模式2则是组织跨学科跨机构的团队开展合作,调动多元的技能和经验来研究和解决问题,呈现出知识生产横向联合的态势[13]。最后,在模式1中,科研场所与社会之间存在明晰的界限,模式2则十分强调政产学研界的交互,鼓励学科外部主体参与质量控制环节,知识生产的评价体系会受到不同学科、不同行动主体的影响。
2 知识生产视域下的科学数据出版图景
根据学者们对知识生产模式的界定及其标准、规范、价值等方面的探讨,不难发现现代知识生产呈现的是这样一种景象:在问题情境下,组织“多节点、多形态、多主体”的聚合型知识群针对具体问题设置解决方案,营造一个受社会、经济、科学等多重标准制约、动态适应的创新生态系统。这与科学数据出版活动存在诸多契合点。因此,梳理和阐释知识生产的演化和特征,可为我们理解科学数据出版实践提供重要的思路来源和分析维度。
2.1 实践情境:广阔、跨学科的应用情境
和其他出版活动一样,科学数据出版具有在应用情境下开展知识生产活动的特性。由于科学研究和社会发展之间的关系越来越密切,科研活动愈发呈现出以某个现实问题或特定需求为导向的特征,国家战略发展和社会发展愈发成为其重要目标。相较于以学科自身发展为目标的传统知识生产模式,面向实际应用场景的科学研究活动在设置知识议程、调动资源、交流以及评价研究成果等方面需要更多地借助学科外部力量,政府部门、产业、研究机构等利益相关方通过稳定的交流和互动建构起一个社会、经济、科学相互交融的知识化场域。科学数据出版是伴随数据密集型科研活动而生的,旨在为大数据时代的科学活动提供服务,因此同样需要将自身置于现实应用情境当中,以满足场域内不同行动主体对科学数据管理、发布、传播和利用的需求。
此外,科学数据的管理和出版还呈现出跨学科应用的特征。由于科学数据来自不同学科领域的观察、计算、模拟等实验活动,多样性较强。例如,就数据集的形式而言,社会科学领域普遍使用的是具有变量和数值的试算表(sheet)数据、物理科学领域经常运用通过计算机模拟得到的模型数据(modeling)、生命科学领域经常使用描述组织结构的编码数据(coded data)。[14]因此,科学数据出版机构不能仅根据特定学科的规律和特征来设置和确定数据出版方案,而需综合考量不同学科的数据体量、类型、格式、结构、应用场景等情况,设置一个不断发展的行动框架,逐步引导问题的解决。
2.2 行动主体:多元、异质性的社会构成
不同的生产活动孕育了不同的行动者网络。和其他科技出版活动相比,科学数据出版尚处于探索阶段,缺乏相应的实践经验和基础设施支持。科学数据对出版来说也不只是工作对象的简单转变,随之涌现的还有数据的持续增长、快速流动、质量不一等问题,这些问题的解决大都是单一行动主体力所不能及的。目前,鉴于科学数据蕴含的巨大价值和潜力,产学研各界等多个能力、体量不一的主体纷纷参与到科学数据管理和应用环节中,涉及科学数据出版的不同层面(见表1)。
表1 科学数据出版的主要行动主体及其特征
| 行动主体 | 代表主体举例 | 行为特征 |
| 政府部门 | 行政部门、立法机关和司法部门等 | 发布科学数据开放共享相关政策;规划和实施科学数据可持续发展战略;为科研活动提供资助;对科学数据知识产权进行管理和监管 |
| 研究机构 | 高等院校、研究所、重点实验室等 | 生成、管理和使用科学数据 |
| 科研资助机构 | 中国国家自然科学基金委员会、欧洲研究委员会、美国国家科学基金会等 | 向科研活动和科研基础设施项目进行投资,并进行资金分配 |
| 图情机构 | 图书馆、档案馆等 | 制定与科学数据管理和发布相关的政策和服务标准;提供科学数据管理服务 |
| 数据中心 | 世界数据中心、Dryad等 | 对科学数据进行集中式存储和管理,大多为非营利性管理机构 |
| 科学学会 | 中国科学技术协会、美国信息科学学会等 | 推动科学数据管理和共享联盟的形成;为科学数据发布相关事宜提供咨询和监督服务的中介组织 |
| 出版商 | 爱思唯尔、施普林格·自然等 | 开发科学数据内容和服务;编辑、加工和发布科学数据;对科学数据进行质量控制 |
| 科研人员 | 不同学科领域的科研人员 | 生产和利用科学数据 |
| 社会公众 | 公众 | 使用科学数据,推动科学数据的价值实现 |
以往,在纸质载体作为科学研究成果发布的主流载体时,一般是由出版机构独自对科研人员提交的手稿进行验证、加工和发布,并对内容资源进行存档和维护。[15]可科学数据作为一种与数字技术紧密相关的科学信息,它的出现无疑会带来一系列出版业务模式以及组织结构的差异,需要更多的技术和管理策略来应对内容组织、处理、发布、存档等问题,解决问题的行动主体也更加多元化。目前,出版机构积极联合其他主体共同实现科学数据出版的功能,如爱思唯尔(Elsevier)和数据平台PANGAEA联合构建了地球科学和环境数据的出版网络,存放在PANGAEA的科学数据和Elsevier在ScienceDirect平台上的相应文章可以相互链接。此外,随着科学数据的价值越来越凸显,图书馆、高校、研究机构等主体开始介入到与科学数据出版相关的活动中,部分承担起数据出版的职能,如美国新墨西哥大学图书馆主持的DataONE项目,针对不同类型的数据建立了不同的质量控制原则和标准,对科学数据进行严格的审查和验证,并借助相关工具对数据进行规范化发布。总的来看,科学数据作为新生产要素的出现,不仅使参与科学信息交流的各方主体的功能边界变得更加模糊,还使出版活动呈现出更加丰富的组织化图景。
2.3 评价体系:宽泛、杂合式的质量控制标准
现代知识生产模式与传统知识生产模式在对知识生产质量的评估标准上有所不同。在传统的知识生产模式中,针对知识生产活动的评价十分强调是否符合科学需求,借助学科专业知识来评议和决定“科学领域中什么知识是重要的”等方面,以此形成知识生产的质量评价体系。但随着科学与社会的互动关系越来越紧密,知识生产还需要考虑国家战略导向、社会需求等维度。这意味着,生产什么样的知识以及如何生产知识,不仅受到科学自身标准的影响,还会受到行动目标的影响,知识生产活动因此具有显著的“合目的性”。[16]
对科学数据出版的评价体系同样会涉及两个方面:其一,对所出版的科学数据的评价,即从结果视角,出版什么样的科学数据内容?其二,对科学数据出版活动过程的评价,即从过程视角,如何开展科学数据出版活动?目前,虽然这两个问题尚未形成明确的答案,但从实践目标来看,科学数据出版致力于传播可信的科学数据,期望为提升国家和地区的科研实力、创新发展能力提供一份支持。因此,科学数据出版在开展活动时须同时考虑科学知识的研究价值和社会价值,其本身也会受到来自科学和市场的杂合式控制(见图2)。这种控制可以通过多种方式实现,如政府部门、研究机构等相关主体通过制定政策、标准、规范性文件对科学数据出版活动进行宏观层面的指导;科研资助机构通过发布政策和资金资助等方式加强对科学数据出版活动的规范,包括推动出版商实施更加严格的数据政策、鼓励和支持出版机构从事数据出版相关活动等。可以说,一项良好的科学数据出版实践是由一系列来自实践情境和行动主体的宽泛的标准来评价和确定的。
图2
3 学术出版商的角色定位与功能分析
本文将科学数据出版定义为一种围绕科学数据进行选择、验证、组织等编校处理,并将相关知识、信息产品面向公众进行发布的出版行为。如今,许多新进入者踏入科学数据出版这一极具发展潜力和增值空间的新阵地,为科学数据发布和传播提供相关服务,数据作者甚至可以绕开出版商完成科学数据的发布和传播。在此趋势下,为了维续在科学内容生产与传播方面的地位,出版商积极开展相应的科学数据出版实践:从内容发布到存储,从质量控制到构建数据出版服务平台,不一而足。
3.1 出版商在科学数据出版中的定位
参照知识生产与知识管理领域的主要观点[17],可将科学数据出版具体划分为科学数据创造与获取、编辑与转化、传播与扩散、应用与价值实现等环节。目前,出版商加速对科学数据及其相关服务进行投资,开展数据加工、传播和存储等活动,其角色定位贯穿数据出版的各个环节,具体包括:①数据创造与获取的支持者。出版商不仅提供数据服务平台帮助科研群体创造和生产科学数据,还规划和开发各类面向或集成科学数据的期刊、数据仓储系统等,为作者提供发表和获取科学数据的平台。②数据编辑与转化的执行者。面对科学数据海量、异构等问题,出版商为实现科学数据的标准化处理、语义增强、数据关联等目的,积极开展基于元数据的科学数据加工、集成等工作。③数据传播与扩散的推动者。出版商不仅通过制定数据政策,推动科学数据开放获取的进程;还通过强化数据检索、推荐、可视化呈现等功能,帮助科学数据达到更好的传播效果。④数据应用与价值实现的助力者。多数出版商联合其他利益主体共同进行数据审查、构建一体化数据共享平台、创建面向多场景的知识服务模式等活动,以推动科学数据的重用和价值实现。
3.2 出版商在科学数据出版中的功能
一直以来,出版商在科学信息交流过程中发挥着重要的作用,包括内容产品开发、科研议程设置、学术质量控制。[18]就科学数据出版来说,出版商凭借其在内容传播、辅助科学研究、同行评议活动中的专业经验,同样在上述方面施展核心作用。
3.2.1 科学数据内容和服务开发
经济学家弗里兹·马克卢普(Fritz Machlup)曾明确指出,“生产”知识不只是指发明、创造知识,还具有散播、传送知识的含义。知识的生产者分别在不同的层次上工作,可能是信息的创作者、加工者、传递者、解释者或分析者等;可通过比较一个个体发出信息和他接受信息的不同程度来衡量某一个体在知识生产活动中付出的贡献。[19]
从上述角度来看,出版商虽然不是科学数据的直接创作者,但它通过对科学数据进行编辑、加工和分析,同样在科学数据生产活动中发挥重要作用。一方面,科学数据经过出版商编辑加工后,可以“数据论文”等形式在特定的数据期刊或常规刊物上面向公众发布。另一方面,出版商通过对科学数据进行解释、分析、再加工,为科研群体提供增值服务,成为内容发行之外的新业务增长点。其中以Elsevier最为突出,其开发的科学数据服务平台Mendeley Data,可以托管任何格式的科学数据,并提供链接论文和数据、数据标识、引用、可视化展示等服务;除此之外,Elsevier还开发了科学数据平台Data Monitor,聚焦于元数据对科学数据发现、传播、交流的重要作用,为科研群体制定更加全面和完善的科学数据管理和使用方案。[20]随着服务科研全流程的重要性越来越突显,出版商将更加专注开发和提升科学数据资源的价值,帮助科研群体获得优质内容和流畅、良好的研究体验。
3.2.2 科研议程设置
出版商携带期刊等传播渠道介入科研议程,向科研群体提供学术论文、信息和评论,在传播科研成果、管理科研议题等方面起到重要作用。从传播学意义上来看,出版商对科学知识生产具有议程设置功能。[21]
如今,在数据密集型科学时代,出版商同样发挥着议程设置的作用。面对急剧增长和日益重要的科学数据,出版商们一方面承袭传统出版模式,拓展数据期刊的刊群规模;另一方面创新出版模式,积极研发科学数据出版平台。这些数据期刊和平台的创建有助于拓展科学研究的边界,以及特定议题的形成和突出。以地球系统科学这一自然科学学科为例,该学科旨在研究组成地球系统的子系统之间的相互作用和联系中的运转机制,以观察和实验得来的数据为研究基础,是典型的数据密集型学科。加之地球系统科学是一门交叉学科,研究对象和问题具有相当的特殊性和复杂性,因此该学科研究领域的确定和拓展十分依赖于现有的数据发现。目前,已有多家出版机构面向地球系统科学创建数据期刊和服务平台,如Earth System Science Data、Geoscience Data Journal、全球变化科学研究数据出版系统等。其中,数据期刊通过设置专栏等方式凸显核心议题,吸引科研人员对重要研究发现进行关注和讨论,促进学科内部前瞻性研究议题和科学社群的形成;而数据出版系统提供的引文、推荐、检索服务可以帮助科研人员识别有用数据、跟踪研究前沿和开展研究活动。
3.2.3 科学数据质量控制
一直以来,出版商在科学知识生产的过程中始终强调出版规范和标准,承担着科研群体十分重视的质量控制功能,也因此区分了正式交流(如期刊论文发表)和非正式交流(如在互联网上发布内容)。[22]随着科学数据在科学研究中占据越来越重要的地位,科学数据的质量也越来越重要,有时甚至会超过数据本身。但由于缺乏统一的科学数据质量控制规范或标准,目前许多科学数据存在数据不完整、无法聚合、缺乏解释性元数据等不足,科学研究面临不可重复危机。此外,如果重用了“伪造数据”“坏数据”,不仅会对科学资源造成浪费,还会损害人们对科学的信任。
为了保证科学数据的质量,出版商要求科学数据必须接受严格的评议程序。在评估科学数据质量时,出版商重点关注两个方面:其一,数据作为科学研究的一部分,与其他相关研究内容是否一致,例如数据必须有效验证研究结论,符合研究目的;其二,对科学数据的规范性进行审查,包括对数据的类型、格式、方式进行规范,保证数据的完整性和互操作性。除了对科学数据本身,科学数据的元数据也必须接受完整的评审程序。为此,出版商针对科学数据和元数据制定了详尽的质量审查清单,以进行细致的科学评估,确保科学数据的可信性。[23]简言之,出版商通过不同方式使科学数据更加完整、规范、准确,这不仅有利于研究成果获得同行乃至全社会的认可,还可以保证科学数据的价值和可用性。
4 结语
科学数据带来了科学知识生产场域的新繁荣和新进展,同时也为科技出版活动提供了新的工作对象和起点。目前,科学数据出版仍有许多挑战和难题有待探索和克服,包括出版商等在内的多个主体正源源不断地为其汇聚力量。对出版商而言,如果以往面临的最具挑战性的问题是信息技术和互联网浪潮,那么时至今日,更值得出版商忧虑的问题是如何拓展自身业务边界,更好地嵌入科学数据出版实践中。未来,科学数据出版领域将持续处于动态发展之中。出版商们必须主动适应知识生产和科学信息交流环境的变化,仔细审视科学数据出版实践与以往科技出版实践之间的“变”与“不变”,遵循知识生产的服务逻辑和发展规律,主动谋求发展机遇和服务增长点,从而在科学数据出版的活动版图中找到立足之地。
参考文献
“Postacademic science”:Constructing knowledge with networks and norms
[J].
The future of scientific journals:Lessons from the past
[J].
Citation and Peer Review of Data:Moving Towards Formal Data Publication
[J].
/
| 〈 |
|
〉 |
