|
|
0. 对所有的词典图片进行统一的精细处理6 Y1 W+ K( P( B9 }/ n
1. 使用本论坛 @孤影 的工具软件,配合按键精灵脚本,对图片自动划线,获取所有词头的坐标0 M/ n2 e/ H0 o: w1 D7 \6 C; ^/ {
2. 使用OCR自动切片导出,得到所有图片的所有词头的切片
8 Q+ b9 v/ E" \2 b# {# }: r3. 新建一个图片(大小同切片),添加文字内容为“aaaaaaaaaaa”(或者类似,用作标识), u$ A/ r; m q1 [5 f9 i! V8 ]7 n! c
4. CMD获取所有切片名称,Excel里添加列,标识每页的开始标识
3 p: G8 E3 E9 S& d5. 使用ImageMagick,在CMD里使用命令 convert -append 0.png 0001.png000.png 0.png 0001.png001.png 0.png 0001.png002.png ... _0001.png 得到最终的合并切片的总体图片, k- e1 d" n" ^/ W9 r
6. 使用FineReader打开这些合并了的切片总体图片,进行文字区域设置,识别,保存为txt
6 L6 j) q) L6 h1 Z7. 正则处理txt(标识为aaaaaaaaaaa)。。。
# B: W2 d1 F, ?* ^* v4 d8. 导入回到步骤①的词头,在高亮匹配提示下,继续进行人工核对6 Z) C2 @$ a7 V1 t5 F; N0 s
+ A2 T1 D3 U6 L+ h$ f8 N9 Q
1 ?; m* ]* t2 \9 O8 J4 f* O: s( L3 z' R3 F8 `- h8 R9 M
! q5 P- w, i$ r1 F! ^, y# p; n
$ c7 g% _8 v& x9 g: w. r5 U: M+ }& v
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
本帖被以下淘专辑推荐:
- · 图片版|主题: 37, 订阅: 40
- · 词典制作|主题: 111, 订阅: 24
- · 图片词典制作|主题: 41, 订阅: 8
|