TA的每日心情 | 开心 2019-5-28 07:39 |
---|
签到天数: 339 天 [LV.8]以坛为家I
|
图像pdf直接可以做成词典。有时间,ocr再来做成文本一样的词典,更好。
" w! k+ v$ B' h: c* q7 g: F5 u5 N. t- V+ F5 S, l' H i
一、pdf对照
9 `+ ~3 H9 ]3 |- j0 s) k(一)把已经ocr的pdf转换成双图层。保存为另一个pdf。
6 ]/ r2 `+ n7 d2 u& j [# p: qhttps://www.onelegal.com/blog/ho ... sing-adobe-acrobat/- K+ I9 ]6 a6 w
如果没有make ocr,见这里最下面的方法。
( k8 o- }; F) B t+ U+ \0 yhttps://community.adobe.com/t5/a ... flight/td-p/91930202 R& ]# Y2 a4 S/ L' t
(二)两个pdf同时打开。窗口---平铺---垂直。后面的pdf只显示文本层。
# S; @, R* g; A+ t1 W8 z或者只打开修改的pdf。窗口---新建窗口,再窗口---平铺---垂直。让一个pdf只显示文本层。
; S, f9 ^4 \2 c! R或者只打开修改的pdf。窗口---拆分,让pdf只显示文本层。(这个只有上下的模式。)
" \3 y" w6 E, G0 w) Z! U其实,第二步,还可以用文档比较,可以同步滚动。但是,我的软件比较的时候出问题,没有进去。
, `$ _3 n* F& f7 v T, W5 r% Q1 s
说明:acrobat自己ocr的,字体是Hidden Horz OCR。单选文本层,文字不可见。
* D+ P7 f( I+ }, \8 B5 P这个用enfocus修改字体,可以显示。有些麻烦。可以试一试三的办法。
% P4 [. o% i% W# v: L1 I+ ~! ?. i i+ O
. C) y& x$ y1 ?8 ^
7 V5 }; V* A! r* K* S' D二、还想到一个办法,一边朗读,一边检查修改文本。6 @9 N3 R6 t, i& b! L/ z
* o7 e5 P3 g- F" k( r0 M& J! O# p9 e$ `. F# x9 ? K e
6 ]. ?* K6 m ?- i0 F
三、就校对来说,还可以把ocr的pdf导出为RTF。黑马校对2004(绿色)的HMCheck打开rtf,至少可以先检查一些错别字。校对保存。% F$ }& p7 ]! [% A/ Y5 z# p
然后,word里面一段一段选择朗读,对照pdf,检查修改为彩色字。最后,可以到pdf集中修改文字。$ E2 k3 V% n: ]& a; s1 E
软件说明。解密版和Install似乎比较复杂,解密版的hmsc2004里面的安装文件可以在windows10运行。但是,我在word里面运行,没有成功。推荐绿色版。
5 C) Q( ]: L- S1 d7 M; f' M4 J6 q
! S7 x+ G2 f- C( \# l1 }. o( t ~. h
4 `6 I* Y. J1 |; O
3 f0 i) F( o4 Y' K/ y0 \0 {6 o1 ?+ n- e/ {
0 s9 ] n! X% d) E o9 i- e5 g# q0 ~4 H- ^9 b$ \' r
4 Z- ?! }. C& G6 n( s9 S
5 p, X+ t. `, v ~
/ H+ j& i1 X6 w6 R5 j+ E/ S0 x3 V# S! p0 c# ?3 z% |7 v- B# i
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
|