|
发表于 2014-5-29 09:37:04
|
显示全部楼层
spoony1971 发表于 2014-5-28 23:55 , W. V( p0 e2 l. Z# Z) Y8 H# n5 J
赞同犯人说,不如OCR后不加校对直接使用(多列转换成文本可能需编程解决),使用过程中发现错误再加以修正。 ... 1 u* P7 k2 m: v, d' M) K
不需要多列转换成文本,ABBYY可以保存ocr结果为txt文本,自动就是按词条的
o M/ z( Z' J) A& c1 K& b( C$ P1 ~' e6 S* L$ z% \- p
我的想法是大家每人领取50页扫描图片,自己用ABBYY软件ocr,这样的好处是在ABBYY里就可以根据软件提示修改识别错误。
# s6 h" l# Y0 x/ R' ]8 z5 ~/ ^' z; `$ l2 C: X0 U- i& l3 s( D5 w: x2 v1 K& S' k
保存为文本后用我的工具格式化,然后校对确认无误后,再通过另外的工具(我可以写一个)整成mdx源文件,完工
5 J! a& S1 M7 q5 ^; V0 E7 c- I
V. T, v1 t; N9 ?5 D) ?( s/ s2 b7 n由于我手头的ocr结果有限,可能有个别地方格式化工具不能对应,这个可以新开个校对专贴来反馈,我可以随时升级工具(保证向下兼容) |
|