欢迎光临
我们一直在努力

数字出版的技术实践

cqtml blog.163.com
白话数字出版(五)
随着人们的研究深入,数字出版涉及到的范围越来越广。本文也只能从一个局部(PC系统数字媒体发布、阅读)描述数字出版技术实践方法;目的是想从技术层面上,为数字出版的高端构思和决策提供一点参考;同时也想抛砖引玉,引起更多的技术同仁参与数字出版的技术实践。
我们研究探讨的数字出版目标是:
● 构建一个不同于WEB浏览方式的数字媒体再现模式,作为数字文档的浏览(阅读)平台。目的是防范非法复制、链接、传递发布的数字资源(就像有了WORD文档,还有PDF文档存在的理由一样)。新的再现模式应该具备多媒体表现功能(不是简单的图形再现)。
● 建立数字媒体的快速递送通道,使数字资源方便、快捷、安全地通过互联网送达读者。
● 受方接收到的数字资源具有收藏性和重复使用性。
一、数字资源的再现模式
互联网成功源于网景公司(Netscape Communications Corp)的Netscape浏览器。从Netscape开始人们进入了“内容”远程发布、阅读的纯数字的时代。随着人们的需求,互联网浏览器迅速发展,数字内容的再现形式越来越丰富,使用越来越方便。
丰富、方便的同时诸多的弊端也突现,不光有病毒、木马、流氓软件的横行,更有非法、违法的“内容”复制、发布、传播。
于是人们开始了非Web方式的网络数字资源的再现研究,显然这种研究一开始就是反标准的(WEB标准)。成功的方法开始被更多人接受后,才形成了新的标准,例如PDF文档(Internet上进行电子文档发行和数字化信息传播的跨平台的文档格式)和PDF阅读器;笔者见到一种国外的企业内部公文处理的非标系统,真是一种绝好的防篡改、防非法传递,权限分明的发布、阅读的公文处理模式。
最简单的网络数字资源再现就是用图形方式。正如上面提到的在线小说的VIP部份;一些想躲避网络检查的问题信息采用图片来表示文字。例如单色图片压缩后它的比特信息容量还是比较小的(A4幅面的也只有十几K)。但这种方法用于正规的数字出版,牺牲的东西也太多了,何况图片的复制也是简单的事情。
计算机上显示的图文,无论最终是什么软件的操作结果,最终都是由操作系统的底层API函数实现的。WINDOWS系统有一种鲜为人知的图元文件,它将文字、字型、格式、颜色及独立于设备和分辨率的图形封装在WMF、EMF文件中,利用底层API函数实现图文再现。图元文件的再现效果非常好,它是矢量图形,可以做到无级缩放,便于数字文档的阅读;它保留了文本内容和文字在页面上的位置,为数字文档的检索查询提供了可能。
我们还可以采用压缩技术将图元文件做得很小。例如,在我们的DW_eBook平台测试资源中,纯文字《红楼梦上部》600多页, WORD文件2MKb,用图元方式做成的dwb文件为2.5MKb;图方混排的的《学VC编游戏》253页,WORD文件4.6MKb,做成的dwb文件6.1MKb。
PDF、FlashPaper也就是采用了图元的方式(当然不会是WINDOWS的图元格式),所以它的版面既有优美的图形特征,又可以包含完整的文本信息,大小适合便于网络传输。
自制一个程序再现自定义格式的信息并不复杂。但要将多种标准的文档转换成自定义格式再现,就不是一件简单的事情。
电子杂志就是不能将传统杂志方便快捷地转换为它的再现格式,失去了众多的内容支持。
PDF成功在于它开放了相关接口,有众多的软件可以将我们能见到图文混排格式转换成PDF格式。
“Macromedia”的FlashPaper之所以受到人们的关注,它就是一个可以将多种图文混排格式的文件简单快速地转换成Flash格式并再现的工具。
国内的方正Apabi、书生使用的是图元再现技术。超星则偏向于扫描图片方式。万方、龙源、维普优势在于资源数据库,提供的下载文档多数是PDF。榕树、起点等在线小说的方法前面已经描述。笔者认为方正、书生的方法更接近国际数字出版的通用方法,因为Adobe和旗下的Macromedia公司战略眼光不会错吧。
二、在线阅读与下载阅读
现在网络的速度是越来越快,但再快的网速增长也满足不了多媒体信息的量的增长。以前网上传的多为图文,现在则要求音像。现在不少的数字文档都比较庞大,动则十几M、几十M(如电子杂志),阅读一般都有一个下载过程,由于文件庞大,下载不得不引入有争议的BT下载(一些地方是限制使用BT下载的),结果使这些数字文档的实际下载阅读量很低。网络阅读多为浏览性(快餐文化?)的,下载阅读显然是迫使读者放弃阅读的重要因素。
图元方式做成的数字文档比较小,这给数字文档的网络递送带来了便利。由于图元具有图形文件的特征,每页数据是独立的,压缩图元文件的一页数据平均量比WEB的页面文件平均量要小,采用按页读取的方法在速度上完全满足在线阅读的需要。
DW_eBook客户端阅读器根据以上原理,采用了无需下载、在线阅读的方法。考虑到读者对数字文档的收藏要求(如果是付费则有所有权要求),我们采取的是边阅读边下载的方法,阅读过的页面自动打包在用户机器上,形成dwb文件;下次阅读时就不用再从网上读取,在不能上网时一样可以阅读本机的dwb文档。这样的方式省去了数字文档的下载过程,一样有数字文档下载到本机使用的特点。
三、数字文档的检索查询
数字文档不能仅仅是纸书的视觉效果数字化,它应该包含更多的数字化优势,检索查询是必不可少的。数字文档应该具有重复使用性,所谓的使用就是能在藏书中迅速找到需要的信息,这是数字藏书的必备条件。
DW_eBook数字文档由于采用了图元转换方式,完全保留了文档的中西文字资源,所以DW_eBook的数字文档dwb是可查询的。
DW_eBook的本机查找,可以在下载到本机的所有dwb文档中检索关键字,这显然是提升了数字文档的重复使用价值。
四、教材教辅发行平台(畅想)
笔者写过两本“学程序编游戏”的书,常规出版与现在技术类图书遭遇一样,原计划的五本书无信心继续。几年来这两本书在网络上仍然被程序入门者使用,咨询邮件从未间断。书无法卖了,读者的需求仍然存在。
我们也曾经做过CAI软件和PC机游戏,产品发布方式是光盘,盗版的猖獗使我们放弃。网络游戏的成功,让我们看到了CAI软件与网络结合的防盗版可行性。于是易发布、防盗版的教学软件发布系统就成为了我们的研究对象。DW_eBook研发的目标就是试图搭建一个教材、教辅发布平台。
书继续写,在DW_eBook上发布。
在DW_eBook上读者可以在线阅读,也可以观看教学范例的运行效果。选择适合的学习书籍。这时的书内容是不能复制的。
付费授权后,读者不但可以将书下载到本机(边读边下载),还可得到必需的教学资源(程序类书的源代码、2D、3D资源等等)、教学计划、实验实习指导,和与作者沟通的资格。
下载到本机的书与读者的其它dwb书构成了一个读者私有的学习资源库,随时可以关键字查询。dwb文档的保护机制使下载到本机的书不能传给他人。
这个想法可能还是诱人的,行否?有待检验。
白话,更多的是不修饰的真话。临池慕鱼,不如退而结网。搞经营的人在经营上探索数字出版模式;做技术的,在技术上多研究一些数字出版实现方法。大家一起努力,共同探索数字出版的路,这就是“白话数字出版”的意图。

赞(0) 打赏
未经允许不得转载:刘旭的人个博客 » 数字出版的技术实践
分享到: 更多 (0)
标签:

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  • Q Q(选填)

QQ :13945502电话:13913571631

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

×
订阅图标按钮