|
0. 对所有的词典图片进行统一的精细处理
7 I, d+ V% u' x; B1. 使用本论坛 @孤影 的工具软件,配合按键精灵脚本,对图片自动划线,获取所有词头的坐标
/ o! N' F- }2 T* s2. 使用OCR自动切片导出,得到所有图片的所有词头的切片
1 O/ j& A" ~% A& l- z& \& m3 w9 n3. 新建一个图片(大小同切片),添加文字内容为“aaaaaaaaaaa”(或者类似,用作标识)
' w f6 g2 R/ W9 e- d* |) A' g* {4. CMD获取所有切片名称,Excel里添加列,标识每页的开始标识
5 {- r v3 _$ u' Q# h; V5. 使用ImageMagick,在CMD里使用命令 convert -append 0.png 0001.png000.png 0.png 0001.png001.png 0.png 0001.png002.png ... _0001.png 得到最终的合并切片的总体图片1 m- f+ A9 H' u; [
6. 使用FineReader打开这些合并了的切片总体图片,进行文字区域设置,识别,保存为txt
. ~5 x; X" P$ L* ~7. 正则处理txt(标识为aaaaaaaaaaa)。。。2 C }4 l6 z0 J# L7 i
8. 导入回到步骤①的词头,在高亮匹配提示下,继续进行人工核对) i& K" S) j/ k1 Q3 L9 q4 w7 ~
8 |" A5 J* k$ d, Q
# v, \( T* w, O: n. c* p
' ]9 \/ `2 f1 p ]
5 Q" p/ ~( Q- y, |7 p5 ^0 T
/ |+ Z; ^$ _- X0 k* [$ l3 w
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
本帖被以下淘专辑推荐:
- · 图片版|主题: 37, 订阅: 41
- · 词典制作|主题: 111, 订阅: 24
- · 图片词典制作|主题: 41, 订阅: 7
|