版权声明: 2018 清华大学
展开
摘要
文章系统介绍了Word文档及Pdf文档中各种插图的提取方式,并对最终提取的图件质量、提取方式做了简单的对比分析;对地学类书稿中可能涉及的各种矢量图件如何转换为排版和印刷可使用的eps图件进行了探讨。这些图件的提取和转换方式,对于广大地学工作者和编辑人员具有一定的借鉴意义。
关键词:
为了形象直观地展现各种地学现象,也为了便于读者更好地理解相关的地学理论知识,在地学类图书中会插入大量的图件;有的地学研究成果本身就体现在一幅或几幅图件中。例如,在全国范围内开展的各种比例尺的区域地质调查,其最重要、最直接的成果就是最终的地质填图[1,2],可见,图件对于地学研究成果的展现和地学问题的阐述,具有不可替代的重要作用。据统计,地学类图书或期刊中,每千字有一幅插图,而且插图功能的强化和插图数量的比重还在进一步发展和增加[3]。因此,地学类图书图件质量的好坏,将直接关系到其应用价值与出版水平,可以说,图件就是一本图书的“脸面”。
作为一名地学类图书编辑,面对地学类书稿中大量的、各种格式的图件,如何将这些图件提取或转换为出版可利用的图件,是一名合格的地学类图书编辑的必备技能。结合笔者平时的工作实践,经过不断摸索与反复试验,对地学类书稿,在其图件的提取、转换方面得出一些实践性强、可操作性的经验技巧,希望这些经验体会与实践技巧,能对广大地学类图书编辑和作者有所帮助,有所借鉴。
众所周知,就图件的格式来讲,图件一般分为位图和矢量图两大类:常见的矢量图格式有ai、eps、cdr、fla/swf、dwg、dxf、wmf、emf等,常见的位图格式有psd、tif、jpg、gif、png、bmp等。这两类图件都被广泛地应用于出版与印刷的各个方面,二者各有千秋,无法替代,在出版与印刷中占据同等重要的地位。目前,各出版单位应用最多的排版软件为方正排版软件和InDesign排版软件,与此两款排版软件兼容性最好的图件格式是tif和eps,对这两种格式的图件的成图与处理软件分别是Photoshop软件和Illustrator软件。
在笔者与作者的沟通中了解到,除了Photoshop和Illustrator软件外,目前广大的地学工作者对图件的生成与处理,使用较多的软件还有Coreldraw、AtuoCAD、MapGIS、Grapher、Surfer等,此外还有各研究单位自行开发的软件,如中石油大庆分公司开发的DFDraw1,西安海卓石油信息技术有限公司开发的Resform软件等。因此,地学类书稿中的图件格式可能是多种各样的,有的图件提供了单独文件,有的已作为文档中的插图部分。那么如何将这些图件或插图保质、高清地利用起来,为最终出版使用,就显得至关重要。至于这些软件的成图与处理的具体操作,这里不做讨论,大家可以参阅有关资料[4,5,6,7],下面仅就如何从文档中提取这些插图,以及各种格式的图件如何相互转换,做重点介绍。
作者所提交的电子文档主要包括Word文档和Pdf文档,但在出版中无论是使用方正排版系统还是InDesign排版系统,均需要单独的图件文件,且兼容性最好的图件格式为tif格式和eps格式。下面分别介绍如何从这两类文档中将插图提取为可供排版软件所兼容的图件格式的方法。
Word文档中所插入的源文件格式一般有位图格式jpg、tif、bmp、png等;矢量图格式emf、wmf等;利用Word软件自带的绘图工具绘制的图形;第三方成图软件生成的图件;格式未知的矢量化图件。
对于Word文档中源文件为jpg格式的插图,一种简便可行的提取方法是:将该Word文档另存为网页文件[htm,html],系统会自动生成一个网页文件,以及与网页文件相关联的文件夹,该文件夹包含两个图件文件,均为jpg格式,其中一个容量较大,另一容量较小,将容量较小的图件删除,将容量较大的图件保存即可。对于Word文档中源文件为png格式的插图,其提取方式同源文件为jpg格式插图的提取方式类似,但关联文件夹中容量较大的图件为png格式,容量较小的为jpg格式,将png格式图件保存即可。上述讨论是以Word文档中只包含一个插图的情况为例,包含多个插图的,将在关联文件夹下生成多对图件文件,将每对图件文件中容量较小的删除,保留容量较大的。对于源文件格式属于这两类格式插图的提取可以批量进行,即执行一次“另存为”操作即可将Word文档中所有的源文件为jpg或png格式的插图提取出来,且提取出的图件容量大小与对应的源文件容量大小完全一致,信息量并未丢失,且操作简单,方便快捷。
对于Word文档中源文件为tif(或bmp)格式的插图,在使用另存为网页文件的方式进行提取时(仍以Word文档只包含一个插图为例说明),将在与网页文件相关联的文件夹下生成一个png格式图件(文件容量较大)和一个jpg格式图件(文件容量较小),但是提取出的png格式图件与源文件相比,其容量大小发生了显著变化。例如,某一插入Word文档中的源文件为30MB的tif格式图件(几何尺寸为27.68cm×20.44cm,分辨率为300dpi),提取出来的png格式图件容量大小仅为1.15MB(几何尺寸仍为27.68cm×20.44cm,分辨率为300dpi);又如,某一插入Word文档中的源文件为22MB的bmp格式图件,提取出来的png格式图件容量大小仅为550KB,图件几何尺寸及分辨率与提取前的源文件相比,并未发生变化。将提取出的png图件与源文件tif(或bmp)图件,在屏幕上放大1000倍进行实际肉眼观察对比,并未发现其画质明显降低,这说明虽然其发生了压缩,但其效果尚可(因为png格式图件具有无损压缩的特征),可以达到一般图书的印刷要求。但对于印刷品质要求极高的图书来说,如何达到所提取的图件与源文件图件画质无限接近的要求呢?在这种情况下,可以将Word文档通过虚拟打印机打印为Pdf文件(注意输出时选择为“印刷质量”,不要选择“标准”),保存该Pdf文档,然后用Illustrator软件打开该Pdf文档进行插图的提取与保存(关于Pdf文档中插图的提取方式,详见3.2)。通过反复对比,发现通过这种方式提取的tif格式的图件,其画质最好。因此,对于画质品质要求极致的图书(如图册),其Word文档中源文件为tif格式和bmp格式的插图可以通过这种方式提取,其效果最好。
上面的分析是基于已知源文件的位图格式,将其插入Word文档中再进行插图的提取,然后将提取的图件与源文件图件进行对比分析。但是一般情况下,对于作者所交的Word文档中的插图,我们一般不容易判断插入的源文件是何种位图文件格式。在这种情况下,可以通过对比Word文档本身的容量大小与所提取jpg或png格式图件容量大小来大致判断:如果提取的图件为jpg格式,并且容量大小在提取前后未发生显著改变,源文件属于jpg格式;如果所提取的图件为png格式,Word文档与提取的png格式的图件在容量大小上发生了显著改变,源文件应属于tif或bmp格式,图件容量大小未发生显著改变的,源文件属于png文件。例如,某一Word文档容量大小为3.58MB,仅包含一张插图,其提取出的jpg格式图件容量大小为3.57MB,可以判断插图的源文件应为jpg格式;某一Word文档容量大小为390KB,仅包含一张插图,其提取出的png格式图件容量大小为380KB,可以判断插图源文件应为png格式;某一Word文档容量大小为21.6MB,仅包含一张插图,但提取出的png格式图件容量大小为仅为262KB,其插图源文件可能属于tif或bmp格式。
总之,如果Word文档中插图源文件是位图格式,若对印刷质量要求并不是极致的图书,完全可以通过另存为网页文件的方式,将其中的位图格式的插图批量提取;若对画质要求极高,甚至是要求几乎是极致的图书,需要分析其插图的源文件格式,再视情况决定采取何种提取方式。
在Word文档另存为网页文件时,发现有部分插图并未提取出我们所需要的图件。那么这些图件属于何种格式,又如何提取呢?在实践中发现,这类插图一般有四种情况:一是用Word软件自带的绘图工具绘制的插图;二是源文件可能为emf或wmf格式;三是用其他矢量图软件生成的矢量图;四是未知格式。具体判断方式是,如果在Word软件中可以直接编辑的插图属于第一种情况;在Word软件中双击该插图可以跳转到第三方软件进行编辑的属于第三种情况;通过这两种方式都不能进行编辑的插图属于第二和第四种情况。所以根据上述的判断原则,可以进行分别提取。对于第一种情况,可以将Word文档中的插图选中,然后拷贝到Illustrator软件中,再另存为eps文件;对于第三种情况,其插图的提取更加简单,直接在跳转出的第三方软件中保存为相应的文件即可。那么如何对第二和第四种情况进行插图的提取?经过反复的尝试,终于提取出高质量的插图,具体方法为:在Word文档中选择该插图,拷贝到Illustrator软件中,如果该图件可以编辑修改,直接另存为eps文件即可;如果该图件不能在Illustrator软件中编辑修改,且图件达不到在Word中的显示效果,可以尝试将Word文档打印为Pdf文件(注意打印时选择“印刷质量”,不要选择“标准”),在Illustrator软件中打开该Pdf文件,经过多次试验,发现这类图件同样可以编辑修改,最终能够成功地保存为eps文件。
总之,对于Word文档中既不能通过另存为网页文件的方式提取的插图,也不能直接拷贝在Illustrator软件中保存为eps文件的插图,并且双击该插图也不能跳转到第三方软件中进行编辑修改的,可以尝试通过将Word文档打印为印刷质量的Pdf文件的方式来提取。
一般说来,作者所交书稿为Pdf文档的较少,似乎讨论Pdf文档中插图的提取这一问题,没有多大的实际意义。但是对于作者来讲,其意义重大,因为作者写就一本图书需要参考大量文献(目前网上可供下载的电子文档常用的有caj格式和pdf格式),有时可能需要引用其中的插图;另外,如果作者提供的单独图件为其他成图软件生成的格式,当我们又不能直接将其转换为出版所用的图件格式时,这种提取方法就显得至关重要,且大有用处。
Pdf文档中插图的提取一般有五种方式。
(1)直接将打开的Pdf文档整体另存为jpg(或tif)格式文件,这样Pdf文档的所有页面将在拟保存文件夹下自动生成一个个jpg(或tif)格式文件,即一个页面对应一个jpg(或tif)格式文件。利用这种方式提取的tif格式图件容量大小与jpg的完全一致,其二者的画质与Pdf文档中显示画质相差甚远,达不到理想的印刷效果。
(2)直接将Pdf文档另存为网页文件htm,这时将在与网页文件相关联的文件夹中自动生成一对对jpg文件,一个页面对应一对jpg文件(每一对中含一个大容量的和一个小容量的,较小容量的删除),但所提取图件画质效果更差。
(3)在打开的Pdf文档中,选择要提取的插图,点击鼠标右键选择“图片另存为”,保存为单独的jpg格式,这种方式虽然可以提取单独的图件,但其图件容量很低,画质较差。
(4)将打开的Pdf文档另存为eps文件,这样可以将所有的页面保存为一个个eps文件,即一个页面对应一个eps文件。这种方式转换后的每一个eps文件容量较大,其中插图为位图格式的图件画质无损;若源文件为矢量图,可以在Illustrator软件中打开后,点击右键选择“取消编组”与“释放蒙版”等命令进一步编辑修改。
(5)用Illustrator软件直接打开Pdf文档,在打开的对话框中输入拟提取图件的所在页面之页码,然后点击打开。对于这种方式提取的图件,其画质和可修改性与第(4)种情况完全一致。需要注意的是,用这种方式提取图件在最后保存文件时,要千万注意,用“另存为”命令,切不可用“保存”命令,否则,就会把原来的整个Pdf文档替换,后果不可挽回!
从以上论述可知,五种提取方式中,前三种由于提取的图件画质较差,达不到出版印刷要求;后两种方式提取的图件画质无损,精度较高,且便于编辑修改,其中第(4)种方式可以批量提取,第(5)种方式可以单独提取某一页面的插图,实际中,可视所需情况选择。
在实际的编辑工作中,我们会面对各种格式的图件,有的是从Word或Pdf文档中提取的图件,有的是作者用专门的成图软件制作的图件。那么如何将这些图件转换为最后排版和印刷所需的图件,以达到最理想的印刷要求,就显得至关重要。
位图格式的图件主要包括bmp、jpg、png等格式,转换为tif格式文件比较简单,只要在Photoshop软件中打开拟转换的图件文件,另存为tif格式文件即可。关于Photoshop的具体操作,读者可以参考有关文献[8,9,10]。需要注意的是,在Photoshop软件中,如果为灰度图,应将图像模式设置为灰度;彩色图应将模式设置为CMYK;若仅有黑白两种颜色的线条图,可以将图像模式设置为位图,这种模式的图件所占容量最小,并且不影响画质。例如,某一灰度模式的图件其容量大小为540KB,设置为位图模式,其容量大小仅为80KB,且画质无损。另外,在最后另存为tif格式的对话框中的图像压缩选项中选择“无压缩”,这种tif图件画质最好,但是如果tif图件文件容量实在太大,可以选择“LZW压缩”选项,在InDesign和方正排版系统,经LZW无损压缩的tif格式图件,印刷时不会报错,也不影响画质。
另外,在Photoshop软件中,对于灰度模式和CMYK模式的图件,其通道选择为“8位/通道”,并检查“图层/通道/路径”窗口的“通道”中是否显示有“alpha通道”,若有,需要删除该通道,否则在方正排版系统中会报错。
Coreldraw软件是目前图文设计人员和地学科研人员广泛使用的一种绘图工具。关于Coreldraw软件的详细操作这里不做介绍,感兴趣的读者可以参与有关文献[4,6,7,8,11]。这里仅介绍如何将Coreldraw软件生成的cdr文件转换为方正排版软件和InDesign排版软件可直接利用的eps文件,以及转换后文件会出现的一些问题。
Cdr文件在打开状态下,使用“导出”功能,可以转换为ai或eps文件,但转换后生成的两种文件在Illustrator软件中打开后会有所区别。转换后的ai文件,其字体字号有时会发生变化,上下标有时会变成平排格式,但文字可以修改编辑,线条的箭头会丢失,文件容量较小;转换后的eps文件,在Illustrator中打开后,所有对象被自动群组在一起,部分中文文本会转换为曲线,其文本的字体和字号保持不变,但有时由于系统字库的原因,中文文本会显示不出来,以“?”代替,不便于修改编辑,线条的箭头不会丢失,文件容量较大。两种方法各有利弊,所以,如果待转换图件以线条为主,可以选择直接转换为eps文件,如果中文文本较多,可以选择先转换为ai文件,然后再在Illustrator中另存为eps文件。
在实际的编辑工作中,还发现cdr文件转换eps文件,可以通过先转换为wmf文件,然后再在Illustrator软件中直接打开wmf文件,文字的字体字号几乎没有变化,且线条的箭头不会丢失,上下标格式不变,极个别情况下,字间距会发生些微变化,只要选择将其字符间距设置为“自动”或“视觉”效果,就可以达到与源文件显示一致的效果,最后将wmf文件在Illustrator中另存为eps文件即可。对于这种方式的文件转换,笔者曾经反复试验,发现部分cdr文件中显示为倾斜的文字会自动转换成曲线,其他的文字未发生变化。所以,当cdr文件转换为ai文件和eps文件效果都不理想的情况下,可以用尝试使用转换为wmf文件的方式。
MapGIS系统现在广泛应用于地学研究及生产领域,有相当一部分地学类书稿会提供MapGIS的工程文件。
MapGIS输出矢量文件主要有3种方式[5,6,12]:通用ps输出,ai格式eps输出和方正ps输出。通常选用ai格式eps输出,这种输出方式,一种是文字按编码方式输出,一种是文字按曲线方式输出,前者输出的eps文件可在Illustrator软件中进行修改编辑,但是由于软件版本及字库不同,有时中文文字会出现乱码,字形字号会有较大偏差,后者输出时,字符精度要求低,字符自动转换为曲线,不会出现乱码或字符显示不全等问题,但是文字编辑困难,如需修改只能删除重新录入。我们可以视实际情况选择其中一种输出方式。
这种转换也可以让作者自己完成,因为作者转换时不涉及所挂字库不同导致的乱码或者字符变化的情况;如果编辑自己转换的话,可以让作者一并把专业字库拷贝,我们放在MapGIS相应的路径下,也可以避免转换后字符变化的问题。
Grapher和Surfer是美国Golden软件公司开发的软件。这两款软件可以根据实际工作中采集的数据,通过变化处理后直接绘制成各种二维图和三维图,广泛应用于地学领域,关于这两种软件的具体操作可以参考相关文献[6]。DFDraw1软件由中石油大庆分公司开发,其生成的文件扩展名为dfd,Resform软件由西安海卓石油信息技术有限公司开发,其生成的文件扩展名为wlp或rsec,两款软件主要应用于各种剖面图的制作。AutoCAD软件,用于二维绘图、详细绘制、设计文档和基本三维设计,在工程地质领域中广泛应用。这五款软件使用起来非常方便,但是其输出结果大部分作者仅以位图格式使用,其画质效果大为降低,达不到高质量的出版要求。
Grapher和Surfer图件都可以通过先输出pdf或wmf或emf3种格式,从而转换为eps文件。转换为Pdf文件在Illustrator中打开后,其文字将自动转换为曲线,其文字显示与源文件未有变化,而转换为wmf和emf文件在Illustrator中打开后,其文字仍为文字格式,但个别中文会显示乱码,系统字库缺失的字体将自动转换为默认字体,显示上与源文件字体有一定差别,但文字可以编辑修改,最终保存为eps文件即可。
DFDraw1软件生成的图件扩展名为dfd,其在DFDraw1中可以另存为Pdf文件,而Resform软件生成的文件扩展名为wlp(或rsec),只能通过虚拟打印机打印为Pdf文件。由dfd文件和wlp(或rsec)文件转换后的Pdf文件,在Illustrator中打开后,图形对象与源文件一致,可以编辑与修改,但其部分文字显示不全,需要重新录入。
AutoCAD软件生成的文件格式默认为dwg,dwg文件不能被常用的Illustrator(或Coreldraw)软件直接打开,但是dwg文件可以在AutoCAD软件中导出dxf格式,而这种dxf图件可以非常方便导入Illustrator(或Coreldraw)软件中,并且可以编辑修改,最后另存为eps文件。
以上五款软件生成的文件最终都可以转换为eps文件,虽然在文字显示上存在一定的问题,但其图形没有发生变化,可以在Illustrator软件中修改与编辑,经文字修改或录入后可以达到高质量的印刷要求,远比转换为位图格式强出许多。这为我们提供了一定的启发:当我们遇到一些专业软件生成的文件,没办法直接转换为eps文件时,可以尝试将其先转换为Pdf(或emf,wmf,dxf)文件,再在Illustrator中转换为最终的eps文件。这不仅为编辑提供了方便,也为作者对图件的应用提供了诸多方便。
为了保证高质量的印刷要求,有矢量图的文件,优先考虑将源文件转换为eps图件使用,但是无论是哪种方式将矢量图转换为eps图件,最终的eps图件与源文件相比,都不是百分之百的一致,总会出现这样那样的问题。所以对转换后的eps图件一定要对照源文件仔细检查校对与修改,确保无误。
(1)Word文档中位图格式的图件提取,需要首先判断源文件的格式,然后视情况进行分别提取。
(2)Pdf文档中图件的提取,优先考虑使用批量生成eps文件或用Illustrator软件直接打开Pdf文档中包含拟提取图件的页面最终保存为eps文件。
(3)利用Photoshop软件可以方便地将各种位图格式的图件转换为tif格式的图件,但在保存时,需要注意其图像模式及通道的正确选择。
(4)当一些由专业软件生成的图件,没办法直接转换为eps文件时,可以尝试将其先转换为Pdf(或emf,wmf,dxf)文件,再在Illustrator中转换为最终的eps文件。
(5)没有哪一种转换方式可以确保转换后的文件与源文件完全一致,因此对转换后的eps文件,一定要对照源文件仔细检查校对与修改,确保无误。
以上讨论的仅为目前地学类书稿中可能涉及的常用图件格式,当然图件格式有多种多样,编辑人员不可能轻易地识别出每一种图件格式,也不可能安装并通晓所有的成图软件,当我们在尝试多种方法仍不能成功地提取或转换为所需的图件时,需要与作者沟通来获知准确的源文件格式,从而采取有效的转换方式。
| [1] |
|
| [2] |
|
| [3] |
地学类科技期刊插图的绘制特点 [J]. |
| [4] |
|
| [5] |
|
| [6] |
|
| [7] |
Coreldraw在地震地质制图中的应用 [J]. |
| [8] |
采用CorelDRAW、Photoshop处理科技期刊插图探讨 [J]. |
| [9] |
科技期刊图形处理方法 [J]. |
| [10] |
地学类稿件插图常见问题及编辑对策 [J]. |
| [11] |
基于CorelDraw软件的地质图制作 [J]. |
| [12] |
MapGIS与一些常用软件的相互调用方法 [J]. |
/
| 〈 |
|
〉 |