|
0. 对所有的词典图片进行统一的精细处理) m1 [& P) x2 g) }* d) Q3 z
1. 使用本论坛 @孤影 的工具软件,配合按键精灵脚本,对图片自动划线,获取所有词头的坐标
. m- f/ o2 c) k0 x R2. 使用OCR自动切片导出,得到所有图片的所有词头的切片
% ^% L5 d5 s! k, _+ N; j. U3. 新建一个图片(大小同切片),添加文字内容为“aaaaaaaaaaa”(或者类似,用作标识)
3 u/ U) ?2 X* [4. CMD获取所有切片名称,Excel里添加列,标识每页的开始标识
/ M+ O& r" y5 D- S. v5. 使用ImageMagick,在CMD里使用命令 convert -append 0.png 0001.png000.png 0.png 0001.png001.png 0.png 0001.png002.png ... _0001.png 得到最终的合并切片的总体图片9 D0 |7 T: p5 T
6. 使用FineReader打开这些合并了的切片总体图片,进行文字区域设置,识别,保存为txt
1 q! J+ k' r' ]0 k3 ?) R7. 正则处理txt(标识为aaaaaaaaaaa)。。。
7 K7 D) W/ L3 B( {( G) {" G8. 导入回到步骤①的词头,在高亮匹配提示下,继续进行人工核对
3 {/ q6 W* l J3 T) ^6 A6 X3 I2 `
/ Q, Y# x+ U/ V' u- M8 ^
# ^3 ?4 Q8 \- q7 l; a5 {
8 {* v9 H3 T Q& G z! w% f9 h1 l6 x% `; m4 F( F$ o v
! k5 j# a. k2 r$ T: d" i6 F$ S
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
本帖被以下淘专辑推荐:
- · 图片版|主题: 37, 订阅: 41
- · 词典制作|主题: 111, 订阅: 24
- · 图片词典制作|主题: 41, 订阅: 7
|