TA的每日心情 | 开心 2019-5-28 07:39 |
---|
签到天数: 339 天 [LV.8]以坛为家I
|
图像pdf直接可以做成词典。有时间,ocr再来做成文本一样的词典,更好。
. i9 J; I7 m7 {* i" v" M: m
8 g) p, S, O+ h# H6 L9 H一、pdf对照. ]* x; y, M# I" f3 E5 ] T
(一)把已经ocr的pdf转换成双图层。保存为另一个pdf。2 s: O7 D/ L* U+ \! G4 ]1 D
https://www.onelegal.com/blog/ho ... sing-adobe-acrobat/7 Y/ G/ i6 [( _4 g9 |2 a" I! z0 e$ o4 X
如果没有make ocr,见这里最下面的方法。" [$ C" \, W6 i7 J; t' C+ N
https://community.adobe.com/t5/a ... flight/td-p/9193020
4 V4 A- ]- {& m" F6 U(二)两个pdf同时打开。窗口---平铺---垂直。后面的pdf只显示文本层。
# H$ `5 `" |" [或者只打开修改的pdf。窗口---新建窗口,再窗口---平铺---垂直。让一个pdf只显示文本层。
0 M0 u- A. |" `" v或者只打开修改的pdf。窗口---拆分,让pdf只显示文本层。(这个只有上下的模式。)
) [: H# T$ b& F( x其实,第二步,还可以用文档比较,可以同步滚动。但是,我的软件比较的时候出问题,没有进去。
$ F' q- J% N. r" o- g
) v: \, P! G. H& w, x% K说明:acrobat自己ocr的,字体是Hidden Horz OCR。单选文本层,文字不可见。" ^7 V, f+ j1 T d
这个用enfocus修改字体,可以显示。有些麻烦。可以试一试三的办法。
- z- ^, B; Z2 Y+ B: r
: M) @/ V% T- e" z* k
8 G. B f7 o, k( g% K9 O3 V7 n/ j: N; ?
二、还想到一个办法,一边朗读,一边检查修改文本。' u- P- y0 m8 U$ N( n
: q) G" P8 `: p/ p
& Q1 _+ G3 c5 ^: r6 z( n9 |$ f
3 j% d: l5 l' V三、就校对来说,还可以把ocr的pdf导出为RTF。黑马校对2004(绿色)的HMCheck打开rtf,至少可以先检查一些错别字。校对保存。- F: g. w; V+ E4 i6 B5 o
然后,word里面一段一段选择朗读,对照pdf,检查修改为彩色字。最后,可以到pdf集中修改文字。% d! y; P) Y! q; |7 v
软件说明。解密版和Install似乎比较复杂,解密版的hmsc2004里面的安装文件可以在windows10运行。但是,我在word里面运行,没有成功。推荐绿色版。6 I9 B! p1 n5 p- s1 K2 J( T
/ Z' X- m7 }0 P1 x! D; p _2 f+ O! K8 b: V
( Z8 L5 c4 Y T
# {+ d/ R+ R- Q/ O! C
& V B T( r8 N8 N3 M' e5 x3 N6 X" n9 _' w; i
+ o6 \, N- w) k0 y; W# x
1 |, ]; Z. |! S2 }1 s$ ?# q
' o$ _( C+ C8 L2 ^8 X) J3 `! V/ `, C j2 L0 j
) U/ }& g$ A. x6 J- ?2 P7 J
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
|