2007年5月3日 星期四

掃瞄辨識

最近因為工作上的需要,找來掃瞄辨識軟體(OCR)。

過去對這類軟體的信心不足,像丹青辨識系統,雖可同時辨識中文及英文,但辨識率僅達八成左右。換句話說,每五字大概有一個字就是錯的,而若辨識完要去修正那些字,我倒寧可重打那五個字。

但這次改用 OmniPage professional 15,缺點是只能辨識英文,但對英文辨識正確率官方稱可達 99%,但據我個人試用的結果,正確率達 100%。不過想想也是啦,英文字跟中文字的數目本就不知道差了多少倍。

另外是掃瞄流程的精簡與迅速,亦稱一絕。一點時間都沒浪費,就一張一張掃過去,並同時讓你進行掃後的確認。

輸出結果可為純文字檔、Word 檔、PDF 檔等。連字型、大小、位置等都正確辨識。如果你拿了一篇用 Word 打的文件,裡面含圖片、表格、各種字體,並將此文件印出來,再用這個軟體辨識完之後,存成 Word 檔,幾乎跟原來是一樣的。

這麼好的軟體還是要讚揚一下,但是不知道能不能將來有一天可支援中文辨識。

1 則留言:

  1. 請問OmniPage pro

    是否可以辨識 Png 圖檔 呢?

    回覆刪除