数字时代无障碍阅读的有声化发展与变革*
关键词:
本文引用格式
余苗, 马璇.
随着技术进步,有声读物日益成为视障群体获取信息和文化知识的重要渠道。数字时代,如何推动无障碍阅读朝着有声化的方向发展,这一问题亟待展开深入的学术探索。
1 数字时代无障碍阅读有声化的现实背景
1.1 环境背景:便利视障群体获取出版作品的《马拉喀什条约》
2013年6月28日,中国签署了为视障人群便利获取出版作品提供了诸多例外与限制的《马拉喀什条约》。根据《马拉喀什条约》的定义,“无障碍格式版出版物”是指采取替代形式使“常规格式版作品阅读障碍者”舒适地使用出版作品的一种作品版本。它可以是印刷品,也可以是音像制品。《马拉喀什条约》并未明确定义“无障碍格式版有声读物”,但根据《马拉喀什条约》对被授权主体的定义可知,“无障碍格式版有声读物”是指由具有公益性质的政府机构或非营利组织为视障人群提供的有声读物。这些具有公益性质的政府机构或非营利组织享有一系列著作权方面的权利与责任,也是法律赋予的限制与例外,即这些被授权实体无需著作权人的授权,就可以将已出版作品以盲文、有声读物等形式进行复制分发,以服务于“常规格式版作品阅读障碍者”。[1]
1.2 政策背景:全民阅读的客观发展要求
2012年6月,中华人民共和国国务院令第622号《无障碍环境建设条例》通过,强调无障碍信息交流,专门指出加强对视障人群提供盲文读物、有声读物。2016年12月,原国家新闻出版广电总局出台《全民阅读“十三五”时期发展规划》,指出加强对数字化阅读的规范和引导,推动传统阅读和数字阅读相融合,加强盲文出版基地建设,实施盲文出版工程,支持有声读物开发,扩大各类盲人读物有效供给,完善盲文出版物、有声出版物邮寄借阅平台。[2] 2020年10月,中宣部发布《关于促进全民阅读工作的意见》,明确指出保障特殊群体基本阅读权益、提高数字化阅读质量和水平。
1.3 技术嵌入:有温度的有声读物
有声读物并不是新鲜事物,很早就有各种读屏软件可以实现从文字到声音的转换。但读屏软件最大的问题在于,从断句到语气均以冰冷的“机器声”“电脑音”呈现,生硬且僵化,读者使用体验欠佳。为提高有声读物的品质和视障读者的使用感,有声阅读平台近几年推出了较多音频衍生产品,如喜马拉雅与华为推出的AI智能音箱,懒人听书推出的智能机器人等。
有声阅读平台的硬件铺设主要分为两种模式,一种是生产成本较低的自有品牌硬件;另一种是与设备生产商合作,有声阅读平台和硬件生产商交换资源。当前,随着人工智能技术的进步,新兴科技正在努力让AI的声音充满感情和表现力。声音是视障群体感受世界的最重要方式,有温度的声音不仅可以让他们感知世界,还可以获得审美的享受。
2 我国无障碍有声阅读的现实境况
2.1 难以获取的版权
“根据世界盲人协会的统计,全世界每年大约有100万左右的书籍出版,但其中只有不到5%的书籍被转换成无障碍格式版本”[3]。中国大陆地区无障碍格式版作品的转换比率偏低,各地盲人图书馆中新出版实体书、有声书的馆藏量较少。中国至今没有真正意义上的加入“无障碍图书联合体”的被授权实体,并且《中华人民共和国著作权法》在以往的修订过程中完全忽视了《马拉喀什条约》的存在,即使是条约中关于被授权主体对著作版权享有的限制与例外这一最低标准,以往修订的相关法条也并未切实达标,内容上也没有履行该公约义务的任何体现。有声读物涉及主体的多样性决定了其版权问题的复杂性,加之中国法律对于有声读物没有明确的版权豁免,要想出版有声读物就必须获得著作权人的授权,这拉长了有声读物的出版时间,增加了出版难度。虽有社会捐助力量,但对于视障读者而言,其阅读需求与版权限制形成较大的矛盾。与普通实体书相比,有声读物涉及的主体除了文字作品著作权人,还有演播人员、录制人员等,这也就导致其制作成本不会低于实体书。尽管无障碍有声读物制作需要投入大量的精力、时间和资金,但因为其是具有公益性质的作品,定价很低,有些无障碍有声读物甚至是免费的。
另外,对于中国盲文出版社这类公益出版机构来说,虽然国家的资金帮扶和社会各界的资助在一定程度上能够缓解无障碍有声读物出版发行会遇到的高成本问题,但因无障碍有声读物市场化程度低,不具备高盈利的可能性,这类公益出版机构很难实现收支平衡,而经济困难必然影响出版机构的进一步发展。因此,目前中国无障碍有声读物的市场认可度不高,大多数出版机构对于是否进入无障碍有声读物出版市场仍处在观望状态。
2.2 参差不齐的录制技术
声音和语言是有声读物的主要传播符号,因此有声读物的质量在很大程度上取决于声音的质量。由于线性传播、转瞬即逝的声音特性,视障读者在进行听觉阅读时需要一次性接收声音所传达的信息,因此声音语言的清晰规范与否是影响视障读者满意度的重要因素,更是直接决定了视障读者会否收听有声读物。人工智能的出现大大提高了有声读物的录制效率,智能机器能够快速进行文本转换和播读,减轻人工播录的劳力负担。但是,优秀的真实人声播录具有语言表达功力强、人格化色彩浓厚的优点,更具人情味、亲和力和感染力,能够拉近读者心理距离,这些都是智能机器暂时无法实现的。
从制作角度看,录制质量影响无障碍有声读物的传播与发展。优秀的公益无障碍有声读物录制人大多由于时间原因无法长期为视障读者服务,因此多采取招募志愿者的方式来填补录制空白。例如,中国盲文出版社有声读物部门就长期招募有志于参与盲人文化志愿服务的志愿者,其大多为播音主持专业或相关专业的在读学生、社会人员。但是,作品录制效果参差不齐,影响视障读者的阅读体验。而用简单的播读软件又太过机械化,很难表达出作品的内在语义。因此,机器录播并没能广泛应用于有声读物的制作。
2.3 趋于同质化的平台内容
由于年龄、文化程度、家庭背景各不相同,部分视障读者对于视障辅助用具、手机、计算机的使用还不甚熟练。公共图书馆、社区阅览室等是他们获取阅读服务的主要场所,但这些场所的基础服务设施建设、无障碍格式版作品资源、助盲服务水平还有待进一步完善。一些为视障读者提供服务的图书馆员对电脑读屏软件、盲用听书机等盲用仪器的掌握并不熟练,视障资源无法得到最大限度的利用。如果公共图书馆缺乏一个友好的“有声”阅读环境,视障人群很可能放弃进入图书馆学习的机会,丧失本就不多的可以获取知识信息的渠道。我国公共数字有声图书馆还处于初建时期,有声读物的资源建构和借阅服务都处于初级发展阶段,平台还不够稳定。因此,加快改善无障碍阅读环境和提升助盲服务水平刻不容缓。
越来越多的互联网品牌开始参与无障碍有声读物的公益发展,如喜马拉雅FM、蜻蜓FM等都开设了专门的无障碍有声阅读(朗读)频道。但由于技术限制,多数平台并未设置更适用于视障读者沟通交流的语音互动专区,现有的互动方式仍大多局限于点赞、评论、转发、打赏,然而这些功能对于视障读者来说并不方便使用,在阅读结束后进行内容反馈与分享的需求得不到满足。目前视障读者只能被动接受平台单方面的信息输入,而无法进行双向交流。多数视障读者仅仅停留在“听过”无障碍有声读物的层面,而他们对信息的接纳程度、对作品的体会感受以及审美效果未能得到有效反馈。
3 数字时代无障碍有声读物的变革限度
3.1 “铿锵有序”:加强国家立法,加大扶持力度
2020年11月11日,十三届全国人大常委会第二十三次会议正式表决通过了关于修改《著作权法》的决定。此次《著作权法》的修改增加“以阅读障碍者能够感知的方式向其提供已经发表的作品”为合理使用的法定情形,[7]具体包括三方面:其一,对于作品使用以及著作权人的权利限制方面有所增改,在注明作者姓名及作品名称、对该作品的正常使用不造成影响、著作权人的合法权益不受不合理损害的前提下,为阅读障碍群体翻译改编已发表作品不被认定为侵权;其二,在不以营利为目的的前提下,提供给阅读障碍者的已发表作品如果无法通过正常途径获取,服务人员是可以绕开保护著作权的技术措施进行资源获得的,这为阅读障碍者服务人员提供了一定的法律保护;其三,新增法条内容不仅为阅读障碍者提供了实质性的优待服务,也在一定程度上履行了我国作为《马拉喀什条约》的缔约国应推动无障碍格式版作品制作与传播的义务。
我国政府相关部门需要在法律上承认“被授权实体”的地位合法性,建立适用的出版管理机制,规定无障碍有声读物制作与传播的规则,为无障碍格式版的跨境交换提供著作权例外。还要扩大“被授权实体”的列入范畴,将中国盲文出版社、中国盲文图书馆、非营利性特殊教育学校等公益机构纳入“被授权实体”的同时,可以在资金投入、税收减免等方面加大扶持力度。只有这样才能充分利用无障碍阅读资源,真正为视障读者提供有声阅读服务。
3.2 “声动人心”:创新精细化服务,强化人文关怀
无障碍有声阅读的基本向度是找准自身定位——以视障读者为中心,突出人文关怀。在新的技术条件下,有声阅读的内容制作者可以根据不同视障读者的喜好制作成不同类型的产品。一方面,采用大数据技术分析视障读者的需求,将视障读者感兴趣的内容制作无障碍有声读物,有效解决传统无障碍有声阅读产品的同质化问题。另一方面,利用语义分析技术和语音识别技术,进一步加强视障读者与有声阅读平台的互动。传统的语音识别框架是通过声学模型、语音模型,解码输出语义结果。而语义分析技术可以用最快的速度和最简洁的语言,将视障读者与相关内容进行关联。视障读者说出关键词或一段话,系统自动分析其可能要表达的意思,进而推送其可能需要的文章或内容。2020年百度大脑3.0正式发布,核心是“多模态深度语义理解”,将其应用于有声阅读,可以改变将人工录制数据音库进行切分与组合的传统拼接技术,既能保留情感特征与输出声音的稳定性,又能节省数据成本,更具经济适用性。[8]
另外,公共图书馆作为所有“被授权实体”中为视障人群提供最多阅读服务的场所,除了完善绿色通道、视障读者专用视听室等基础服务设施,还要加强图书馆员和志愿者对视障辅助用具的熟练使用程度和精细化服务水平。公共图书馆可以创新有声读物导读环节,与知名学者、专家进行合作录制导读音频,推荐无障碍有声读物,给视障读者带来新鲜感和趣味性。
3.3 “以声传意”:落实阅读保障,便捷生活使用
保障无障碍有声阅读的发展,需要视障读者、被授权实体和政府的紧密合作。政府在提供法治保障的基础上,要加强有声阅读资源建设、提升阅读服务水平、注重与国外被授权实体的信息共享,努力构建包括公共图书馆、残疾人联盟、盲人协会、社会爱心组织等在内的视障人群阅读服务联盟,将特殊阅读服务体系化、规范化,以求提高资源使用率、扩大视障人群受益面,推动无障碍有声阅读的发展。
大多数的视障读者最开始接触的阅读形式通常都是有声阅读,如广播、电视或亲友的朗读。随着技术的进步,有声读物形式越来越多样化,如专门的盲人听书机、读屏计算机等智能阅读设备为视障读者提供了更便利的阅读条件,但也存在资源有限、更新慢等问题。因此,无障碍有声读物制作者要不断引入新技术,加强视障辅助工具的功能,提升视障读者的阅读体验。例如,中国盲文出版社年均推出120种、200小时盲人有声读物。截止到2020年12月,中国盲文图书馆共采集有声读物9 194份,馆内有声资源时长已达4.5万余小时,设有20个大类近100个子类。公共图书馆、社会公益组织、互联网平台积极举办有声阅读活动,定期开展有声读物分享会、朗诵大赛、共听书等特色文化活动,以“听书+朗诵+分享”的线下讨论形式增强视障读者对有声阅读的兴趣。
目前无障碍有声读物已囊括了经典文学、流行小说、名家讲坛、法律法规等各方面的内容。虽然品种大幅增加,但更新速度较慢,难以满足庞大的视障读者的阅读需求。因此,需要在全国范围内对视障读者进行有声阅读的深度调查,有效描绘数字阅读环境下的视障读者画像。另则,国家主管机构和无障碍有声阅读平台要继续保持健康、积极、正面的文化价值引领,同时便捷视障读者的生活,加强生活、教育、医学、儿童读物等热门类别的无障碍有声资源建设。
3.4 “声势浩大”:新兴技术助力,推动数字出版
随着人工智能的发展,数字出版商推出了众多AI产品,进一步推动无障碍有声阅读的发展。例如,喜马拉雅推出了“小雅”AI音箱,产品覆盖了300多类6 000多万条有声内容,定位为家里的“有声图书馆”。这类AI产品最重要的特点就是“只需动口、无需动手”,为视障读者提供阅读便利。同时,一些科技公司也在提高手机应用的无障碍适配度,如搜索类APP夸克就在2019年5月推出了无障碍版本,在修复完善了145个无障碍相关技术点后,又在同年推出语音助手“夸克宝宝”,其语音识别能力强、语义理解等级高,成为视障用户进行网页搜索的首选。Android也开发了Android-Accessibility(辅助功能/无障碍,自动安装App)以及类似于读屏软件的无障碍插件应用。这些都为视障读者更好进行听觉阅读提供了技术支持,有利于促进我国无障碍有声读物的制作与传播。[9]为更好地提升视障读者听觉阅读服务水平,还要对视障读者进行实际的操作培训,使其了解视障辅助用具,提高设备的使用比例。
尽管我国大多数视障家庭的经济情况不容乐观,但视障群体有着巨大的文化消费需求,无障碍有声读物极具市场潜力。国家也在立法层面为无障碍有声阅读作品提供了坚实的保障。因此,出版商应当审时度势抢先进入无障碍有声读物市场,也应紧跟互联网时代数字出版的步伐,推出更多方便视障读者使用的有声读物,为视障读者提供多样的数字化服务。这不仅能够有效促进我国公益出版机构健康发展,也有利于我国无障碍格式版作品的制作与传播。
另外,各大数字图书馆应积极引入新媒体与互联网技术,如合成语音、点字技术、智能导学等进行网页建设,兼容读屏软件,通过招募线上服务志愿者,提高无障碍有声阅读的在线服务水平。这种数字化的无障碍服务能够很好地为视障读者创造线上阅读条件,使其得以平等共享无障碍有声读物资源及服务。
3.5 “听声悟情”:诠释阅读本质,丰富审美体验
无障碍有声阅读的深层追求在于通过声音传播丰富审美体验,将优质的作品有声化,让读者感悟声音之美。数字时代的有声阅读是对传统无障碍有声阅读的升级,在由新兴数字技术构建的阅读空间中,有声阅读强调通感移情和立体化审美的过程,主要体现在两个方面。一方面,通过新兴技术实现的稳定、连续的语音能够增强有声阅读的良好体验,帮助视障阅读者直接感受声音最本真的美感。从前传统人工配音,多为机器合成语音,体验感不佳。特别是当文本题材类型与语音风格不匹配时,毫无情绪起伏的机器声,难以表达出文本的生动性和感染力。数字时代的有声阅读突破这种浅层次的体验,深入到言语所构筑的丰富多彩、鲜活灵动的意象世界。例如,有声的环境仿真声能够进一步体现文本内容,帮助视障阅读者感知、想象、领悟,达到身入其境的沉浸感,提升言语的审美体验。另一方面,随着声音与作品文字的碰撞,从通感的艺术审美角度,使声音表达的言语内容活灵活现,具有立体感。例如,标贝科技的情感合成技术,基于深度神经网络技术学习,为合成语音加入“情感”。即是技术使音色达到自然的抑扬顿挫、情感起伏,赋予声音更多表现力和个性化。同时也带给视障阅读者几近真人的流畅舒适听觉体验。达到在言语美的不断影响下逐渐深入到声音与想象、情感的质变。
“想象的作用可谓大矣,它可以把社会斗争和自然景物、宇宙万象和人间奇迹、崇高理想与严峻现实、浪漫神话和民间传说、遥远往事与现实未来、客观存在和缥缈幻影、天涯海角和近在眼前等通过想象的纽带联结起来,从而展开灵活自如的构思,为深化主题、增强艺术魅力服务。”[10]例如,满足不同场景使用的有声阅读。儿童教育、车载、泛娱乐等多场景使用,可根据不同场景,提供契合场景的语速和语气,打造高品质情感合成语音效果,提升用户的交互体验。帮助视障阅读者适应不同的环境,根据自己不同的审美情趣,得到多样的审美体验和享受。
参考文献
/
| 〈 |
|
〉 |
