ABBYY FineReader OCR识别

ABBYY FineReader这款OCR识别软件确实很好用,识别率很高,如果有文字识别方面的需求不妨可以用用。

前端时间想将扫描的文本转化成文本格式,于是google下网络。发现主要的OCR识别工具有汉王OCR、清华紫光OCR以及尚书七号这几款软件,根据大家的一些使用评价就选了尚书七号下载试用了一下。发现中文识别还可以,只是英文识别实在不行,要修改的地方实在太多,还不如直接打字来得快。

于是继续google。不经意间(很多有价值的东西都是不经意间发现的,所以准备一根烂笔头记录下来肯定没错),发现强大的ABBYY FineReader这个东西,大家基本一致说很好很强大,于是经不起诱惑就想下载用用。但是找来找去却只有试用版,版本从8.0到10.0的都有,完全破解的没有(请原谅我吧,据说这款软件要上万米,实在承受不起),最后找到一个带试用破解的10.0版本(忘了在哪下载的,文件包比较大,有四五百兆;不过google下“ABBYY FineReader 破解补丁”应该可以很快找到)。

这个破解只是解除试用天数限制的,功能上还是试用版的功能。就是说,你可以无限期试用下去。当然,功能上限制好像比较多,特别是多语言的页面。当我运行破解补丁后再进行扫描识别,如果一个页面选择简体中文和英语两种语言,就会出现莫名其妙的错误,我估计是试用版的限制吧。不过还好,我只是想要识别英文文档,这个试用版刚好满足我的需求。如果想要识别中文文档的话,国内这几个软件应该都做得不错了。

这几款OCR软件用下来,我觉得词库与词语分析还是不可缺少的。很清晰的文字当然都比较容易辨认,但是遇到比较模糊的、杂点较多的,词法句法分析就变得重要了。一个字母、单词、词语不能识别为库中内容,就需要做词语分析了。这方面英文确实容易操作些,比如一个单词中间有个字母完全没辨别出来,但这个是什么单词一般都能匹配出来;中文字形比较复杂,而且字体多样,所以词库分析就需要比较大的代价。当然,我一个门外汉也只能理解到这个程度了。文字识别一般个人需求不是很强,但有时候还是能救救急的。

    • that5
    • 一月 23rd, 2010 2:40下午

    我去看看,上次找了很久OCR方面的一直没收获

  1. 还没有引用通告。