工作中流通的纸质文档、数码图片资料越来越多,在援引这些资料时,怎样从传统的打字录入电脑方式中解脱出来?汉王文本王7600提供了“一键OK”资料电子化的简单方式。OCR通称为文字识别,它是Optical Character Recognition(光学字符识别)的缩写。是让计算机认字,实现文字自动输入的一种快捷、省力的文字输入方法。由于它录入速度快、准确性高,操作简便,能大幅度提高工作效率,适应信息时代快节奏的要求,因而具有广泛的发展前景。
文本王产品是汉王在OCR应用领域的尖端成果,主要实现纸制资料向电子文档转换.文本王产品一向在易用性方面做得不错,笔者做了现场测试。选取“高考试卷”中的某一页,其中混排有图片、文字还有表格,依照操作提示按下快捷键,页面上的所有内容便自动录入到Word文档中。拿出原稿对照,屏幕上所显示的内容竟然几乎分毫不差,这是文本王所谓的“精确版面还原”功能,完全不需要再像以前一样进行复杂的排版,效果令人惊叹。难能可贵的是,文豪7600对文稿的适应性很强,哪怕是清晰度差、排版混乱、纸张老旧的档案资料、书籍材料,文豪7600都可将其准确识别为电子文档,看来它还真有点无畏苛刻的勇士精神。为了测试文本王识别的准确率,笔者特别打印了一页排满小六号文字的内容,放入文本王扫描,卡表看来,整个过程只花了半分钟,发现需要修改的识别结果不到十处。如果不计同样的识别错误,如把“王”识别成“干”,实际识别的错误要更少。识别界面上显示,在校正处都以特殊颜色标注,当然,用户也可采取分步式操作,即版面分析、识别和校对,需要留意的是识别准确率与原稿的清晰度及字体、文件摆放等都有关。接下来就可以将内容随意编辑、检索、引用了。既然已经录入成WORD格式,当然是想怎么修改就怎么修改。
文豪7600不仅继承了文本王家族的优良传统,更是拓展了文本王的识别范围,新增了对数码照片和PDF、Caj等格式电子图片的识别能力。在工具中,附带了一个名为“汉王屏幕识别”的小程序,它可以对数字图象中的文字进行识别。这个功能让经常阅读PDF文档想复制却无从下手的笔者很是欣喜。估计为了应对扫描仪市场不断萎缩、数码相机市场不断扩张的局面而设置的。有趣的是,笔者在航空展上匆匆用相机拍下来的一张通用飞机引擎介绍的标识牌的照片,尽管因为光线不均、视觉形变而字迹有所模糊,何况还是灰底黑字,经过文豪7600,竟然也能准确识别。它的使用很简单,先打开需要OCR的图像,然后点击图像识别工具条上的“识别”按钮,框选需要识别的区域就可以了。这个功能真是实用,比如你可以随时用数码相机拍摄有价值却不便带走的资料等,之后用此功能对拍摄内容进行识别。只要是200万像素以上的数码相机,采用微距模式就可以有相当不错的识别效果。
此外,“拼接精灵”也是文豪7600一个新增功能,该功能可拓宽扫描纸张范围,A4以上各类图片可随意拼接。拿一张A3幅面的报表来说,笔者把它对折成两半,左右两边分别扫描。同时实验了一下“插入标记”的方法,把图表的对接点分别做了标志。这样,点下“拼接精灵1.0”就实现了精确拼接,把A4幅面图像拼接成A3图像,直接保存到电脑中了。屏幕中拼合的表格线框没有变形,而且表格中的文字也完美地对接上了。借助“拼接精灵”这一功能,估计以后就不必再耗费成本购置大幅面的扫描仪了。有了这些改进,文豪7600人性化方面的表现更加出色,它无疑是那些想把文档电子化的用户的福音。
附图:
扫描高考试卷样张
6000字的样张
标签:文本王