科技与出版,2017, 36(4): 26-28
doi: 10.16510/j.cnki.kjycb.2017.04.008
应熟悉数字化出版资源的管理
沈菁
上海出版印刷高等专科学校,200093,上海
 
【关键词】 

【Abstract】 

从广义上讲,出版资源是出版物产品形成过程中必须加以开发、利用的各种社会资源,包括人才资源、物质资源和信息资源。从狭义上讲,出版资源是指信息资源中可以成为出版物内容的精神文化成果资源,所以有时也称“出版内容资源”,其主要特点在于不会像物质资源那样在生产过程中被消耗后就不再保留原有的使用价值,而是会转移到出版物产品中形成新的资源,并通过后续的开发、利用而不断扩大和增加使用价值。本文中的“出版资源”是就其狭义而言的。

为了对已有出版资源进行开发、利用,必须对它们实行有效的管理。在印刷型出版物的生产中,出版资源的类型相对比较简单,基本上就是文本类和图片类(包含图像和图形),管理也相对简单,一般由总编办与出版部门协同管理。数字出版中需要使用的数字化出版资源,通常称为“数字内容资源”,其类型要丰富得多,不仅有文本类、图像类(包含图形),还有其他各种类型,对它们的管理也就复杂得多,一般需要出版专业技术人员专门负责。

数字内容资源的管理是出版单位业务系统中的关键之一,管理的效率高低对数字出版产品的生产和后续内容服务的效果具有重要影响。因此,2016年全国出版专业职业资格考试在“初级实务”科目的试卷中设置了一道关于数字内容资源库管理的综合题(第78-B题,原题请见本期第134页)。本文拟结合对考题的分析,帮助考生正确认识数字内容资源管理的有关要点。

1 正确判断数字内容资源的类型

不同类型的数字内容资源,在用途和加工处理需使用的工具软件方面都存在不少差异。因此,在把某种数字内容资源存放到资源库中时,首先要正确判断资源的类型,把相同类型的资源集中存放到一个子资源库中,然后再根据其他标准和资源本身的具体特点把子资源库中的内容文件分别置于相应的不同目录下。这样才方便以后的调用。根据实际工作的需要,考题也首先要求考生正确判断数字内容资源的类型。

数字内容资源的分类可以从不同的角度进行,如按内容的表现形式、产生方式、结构特征、加工环节等,而按内容表现形式和内容结构特征划分,是数字出版发展程度各不相同的许多出版单位都需要进行的基础性工作。所以,考题也主要从这两个方面考核对数字内容资源的类型判断。

1.1 从数字内容表现形式角度判断文件类型

就数字内容资源的表现形式而言,一般可以分为七类—数据、软件、文本、音频、视频、图像和复合数字对象。考题为了避免过难,只选择了其中的后五类进行考核,并对各类内容材料也作了对考生也有一定引导作用的简要介绍。

文本类资源的特点是只用文字符号来表达一定的内容。TXT格式的文件主要存储文字符号,并且除了段落划分以外,对字号、字体、字行缩进或对齐等一般的文字格式都不支持,当然更不会支持图像、声音等其他类型的信息,但是它通常可以作为文字素材文件导入或拷贝到其他格式的文件中。题中已经说明“教学文案都是TXT格式文件”,因此,它无疑应该属于文本类资源。

音频类资源的特点是记录以有声语言、音乐和客观世界各种声音表达的内容。利用一定的设备,可以把用模拟方式或数字方式记录在物质载体上的信息还原成人的听觉器官能够感知的声音。题中的英语听力材料是用数字录音设备录制的,可以让使用者借助设备重新听到英语朗读的声音,所以它应该属于音频类资源。

视频类资源的特点是记录活动的画面内容,并且还常常兼记录与画面有关的声音内容。题中的教学实录是用数字摄像机拍摄的课堂教学实况,能够连续不断地把教学活动的场景画面展现出来,让人们看到和听到。因此,它属于视频类资源。

图像类资源的特点是记录固定不动的单幅画面,并且是不包含声音信息的。题中的教育理论资料是对图书进行扫描后形成的JPEG格式文件,而JPEG是一种采用压缩编码方法记录图像的文件格式,其压缩率是目前各种图像格式中较高的。既然题中已经说明教育理论资料是JPEG格式文件,它便属于图像类资源。

复合数字对象类资源的特点在于它是一种数字内容集合体,其中往往包含了不同的媒体形式(如文本、图像、音频、视频等)及不同存储格式(如PDF、PS、PPT等)的电子文件。题中已经交代“甲出版社拟建设一个教学内容资源库”,而从前文分析可知其中收录的内容包括文本、视频、图像等类型。由于初中数学产品包是将该资源库中各项相关内容进行整合后形成的产品,显然其中会包含多种媒体及多种格式的文件,所以,它作为一个信息复合体,属于复合数字对象类资源。

从考试情况来看,现在的考生绝大多数是90后出生的,从小就接触计算机比较多,对数字内容的多种表现形式及其常用的文件格式都比较了解,况且题目又采用了相对较为容易回答的选择题形式,所以绝大多数考生能基本准确地判断出数字内容资源的具体类型。

1.2 从数字内容资源结构特征角度判断文件类型

从数字内容资源的结构特征角度来看,它们可以分为结构化数字内容资源、非结构化数字内容资源和半结构化数字内容资源。

结构化数字内容是指存储在数据库里、可以用二维表结构来逻辑表达实现的各种数据和记录信息。题中的数字化题库,已经说明是从“教辅图书的电子排版文件中提取出来的,并按知识点、难度、题型、来源、分值等元数据分别对每道题目作了标引后形成的数据库文件”,所以它肯定属于结构化数据。

非结构化数字内容是没有明显固定结构特征的各种数据和记录信息。PPT格式文件用于以幻灯片形式演示文字、图像、图形、音频、视频、动画等所表现的内容,数字音频文件是通过对模拟音频信号进行取样和量化转换而来的,数字视频文件是用数字摄像机拍摄、剪辑后形成的,图像文件反映一个画面,它们都没有一个固定的数据模型,难以分解成一个个有规律存在的结构成分来用数据库存取,因此都属于非结构化数据。由此可见,题目中的教学课件、英语听力材料、教学实录、教育理论资料都属于非结构化数据。此外,TXT格式的文本文件仅仅是文字符号的集合体,并没有固定的结构标志,也难以借助数据库存取。所以,教学文案应该也属于非结构化数据。

半结构化数字内容介于信息完全结构化的结构化数字内容和信息完全无结构的非结构化数字内容之间。它具有一定的结构,但是结构变化较大。由于结构变化不固定,所以不能够简单地建立一个二维表来和它对应。比较典型的半结构化数字内容有XML文件。它一般是自描述的,对内容的结构属性采用国际通用的标记语言说明,属性标记与内容相邻线性排列,但与内容本身又是分开的,独立性较强。计算机读到标记后,就能自动判断相应的内容数据在整个作品中的结构属性。因此,可以通过设定转换规则来让计算机自动实现内容数据的结构化处理或非结构化处理,以适应各种用途的需要。题目中提到的各种教学资源内容中,还没有采用半结构化类型的文件。

至于题目中出现的“复合结构化数据”这一概念,则属于干扰项。现实中还没有这种数据类型。

从考试情况来看,不少考生明显表现出对有关结构化数据和非结构化数据的知识掌握不到位,不清楚两者的区别,甚至于多次选择了“复合结构化数据”这一干扰项。可见,考生们虽然比较熟悉一些计算机文件的类型,但是对于体现数字出版重要特点的知识并没有牢固把握,在真正从事数字化出版资源管理工作时难免出现差错,因此非常需要再认真地学习辅导教材。

2 把好数字内容资源入库的审核关

数字内容在加工完成后,就可以添加到数字内容资源库中。不过,并不是加工人员自己就可以添加的,数字内容在入库前都必须经过审核程序,审核合格的才可由专门的资源库管理人员将之添加到库中。这样才能保证数据内容的系统性和完整性,正确理清数据内容之间的逻辑关系,以更好地对这些内容进行有效的管理和使用。可见,入库审核这道程序是十分重要的,所以考题也将它作为考核的内容之一,并且还要求考生列出在审核拟入库内容资源时需做哪些工作。

数字内容入库时需要进行的审核程序大致包括三方面的工作。

第一,审核内容资源本身是否完整、全面、系统。例如,要检查文本类文件是否已经包含应有的全部内容,防止缺漏;音频类、视频类文件是否可相对完整地展示某个作品或其片段,是否存在局部损坏而不能正常播放的现象;图像是否可正常打开,并展现完整的画面等。

第二,审核数字内容文件的题名是否完整、规范、合乎要求。一种数字出版产品一般包含多种电子文件,且它们的类型也往往不同。在产品制作过程中,常常要根据内容的表现特点调用资源库中相应类型的文件。为了让众多的内容编辑人员和计算机程序员操作方便、有序、准确,更为了保证最终产品中各种相关项目能顺利实现,资源库中各种文件的题名必须符合整个出版单位统一制定的命名规则,体现出类型、结构化特征和内容主题的层次。因此,在数字内容入库前,管理人员必须对其中各个文件的题名进行审核,并对其中不符合本单位既定命名规则的,提出修改建议后退回内容加工人员重新拟定。

第三,审核内容资源的标引信息是否准确。这主要是审核各种必备标引信息的正确性、完整性和规范性。需要检查的标引信息,一般包括对内容资源的分类、内容资源的主题、内容资源的版权情况及其他元数据所作的标引。如果发现某种数字内容存在标引信息缺漏或标引未到位的情况,就不能允许入库,而要退回标引加工人员返工。

很多考生对这个问题的解答不够理想,失误比较多。如不少考生误以为在数字内容入库时应该进行的程序是“对内容进行校对”。这就把数字内容资源库建设的流程搞颠倒了。资源库建设过程中确实存在校对环节,但它处于对数字内容进行编辑加工的阶段。到入库时,内容应该是已经确定的,所以就不再存在校对环节。分析出现这种错误的原因,主要是大部分考生对于数字内容从获取到编辑加工,再到审核入库及后续的保存备份这一系列内容资源管理流程还不够熟悉,对流程中每个环节需要做的具体工作也还不够清楚。这在数字出版工作实践中,可能会导致发生比较重大的质量事故。因此,认真、仔细地学习辅导教材,并紧密结合实际工作加深理解,既是通过考试的重要条件,更是做好数字出版工作所必不可少的。

参考文献

[1] 国家新闻出版广电总局出版专业资格考试办公室. 数字出版基础[M]. 北京电子工业出版社2015.
[2] 全国出版专业职业资格考试办公室. 出版专业基础•中级[M]. 上海上海辞书出版社2011.
[3] 国家新闻出版广电总局出版专业资格考试办公室. 出版专业基础•中级[M]. 北京商务印书馆2015.
资源
PDF下载数    
RichHTML 浏览数    
摘要点击数    

分享
导出

相关文章:
关键词(key words)


作者
沈菁