|
0. 对所有的词典图片进行统一的精细处理
9 b8 d% R- b( N% K5 F, z1. 使用本论坛 @孤影 的工具软件,配合按键精灵脚本,对图片自动划线,获取所有词头的坐标
) [0 O7 y8 F- a! p$ B2. 使用OCR自动切片导出,得到所有图片的所有词头的切片
+ S8 e6 ]! B8 [4 @4 @, p! j! E3. 新建一个图片(大小同切片),添加文字内容为“aaaaaaaaaaa”(或者类似,用作标识)$ T8 n n/ O6 Y; O' f
4. CMD获取所有切片名称,Excel里添加列,标识每页的开始标识
& _: E# p7 H. { L5. 使用ImageMagick,在CMD里使用命令 convert -append 0.png 0001.png000.png 0.png 0001.png001.png 0.png 0001.png002.png ... _0001.png 得到最终的合并切片的总体图片8 A8 c2 q3 b6 e
6. 使用FineReader打开这些合并了的切片总体图片,进行文字区域设置,识别,保存为txt
/ j% f5 L$ I+ c) G5 r" C: ]7. 正则处理txt(标识为aaaaaaaaaaa)。。。+ b- e7 v1 u$ d9 M
8. 导入回到步骤①的词头,在高亮匹配提示下,继续进行人工核对7 D; H+ e- ~9 ~% V1 _" l, `* Z" E
+ d$ z7 s; Z' Y- p9 J% g7 d( U" v
& |' A. [8 ~; { h4 w) Y% A) r6 {' K( V1 y6 K5 h, }. f, @
% m3 K- q6 X1 f# ]! Q# u
1 m' o3 d+ b/ g; w$ L+ X1 m! W |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
本帖被以下淘专辑推荐:
- · 图片版|主题: 37, 订阅: 40
- · 词典制作|主题: 111, 订阅: 24
- · 图片词典制作|主题: 41, 订阅: 7
|