|
|
0. 对所有的词典图片进行统一的精细处理
- g0 u1 C& @6 u! T1. 使用本论坛 @孤影 的工具软件,配合按键精灵脚本,对图片自动划线,获取所有词头的坐标% y1 g+ T# h; b3 q9 `& W- ?( i; [
2. 使用OCR自动切片导出,得到所有图片的所有词头的切片
. o0 R' k) G! i+ {3. 新建一个图片(大小同切片),添加文字内容为“aaaaaaaaaaa”(或者类似,用作标识)! E* s; s \( E4 P0 `
4. CMD获取所有切片名称,Excel里添加列,标识每页的开始标识 y, ^) f4 j" J N
5. 使用ImageMagick,在CMD里使用命令 convert -append 0.png 0001.png000.png 0.png 0001.png001.png 0.png 0001.png002.png ... _0001.png 得到最终的合并切片的总体图片: `1 A6 j1 S& M# Y" `$ I0 o
6. 使用FineReader打开这些合并了的切片总体图片,进行文字区域设置,识别,保存为txt
6 I- e2 X" J& `3 z5 s2 B$ S7. 正则处理txt(标识为aaaaaaaaaaa)。。。3 Q; S& `8 H& F3 Q4 T9 f/ s' a/ s8 c
8. 导入回到步骤①的词头,在高亮匹配提示下,继续进行人工核对
3 F- M( b9 s- b+ S% i
" }3 g& p4 ]' E! W8 T, m& X% T3 ~$ n1 T7 v$ \% l
a1 B: v( A/ T9 Y F* H
* v) `1 w9 U# _" r; `' ?: l$ t8 S: q I0 w; d. |7 M7 j
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
本帖被以下淘专辑推荐:
- · 图片版|主题: 37, 订阅: 40
- · 词典制作|主题: 111, 订阅: 24
- · 图片词典制作|主题: 41, 订阅: 8
|