TA的每日心情 | 慵懒 4 天前 |
|---|
签到天数: 2396 天 [LV.Master]伴坛终老
|
发表于 2020-8-4 04:40:53
|
显示全部楼层
eeshu 发表于 2020-8-3 10:26, I5 G3 @& N3 e0 @, ]0 s2 O
已经上传链接:https://pan.baidu.com/s/1sapNgJXdDx6cRueVIKVP3g ; m, S, ^ {# ]$ v. A
提取码:kz89,请试试你的各种法宝。 ... , ~( c# B+ b) d
楼主试过的acrobat、foxit和smallpdf软件,我就没有试,我用了如下软件:Apabi Reader、Caj、SumatraPDF、Calibre、PDF2TXT、txtFormat和Wondershare PDF Converter,前三种和最后一种成功转换,Calibre、PDF2TXT和txtFormat失败——根本没有汉字!文件也是最小的三种;原文件和转换后的文本文件列于下,文本压缩包见附件。) ?$ m/ ^" ]+ r8 F# r, P ^
从转换效果来看,Apabi Reader和SumatraPDF最好,基本与原文一致,Caj次之,Wondershare PDF Converter转换的每个汉字之间均有空格。Caj是这几个软件中唯一能正确双栏显示Pdf的,其他几个都只显示单栏;Calibre名气不小,而且支持的格式最多,但这次失败了;PDF2TXT批量转换较快,但经常有乱码。
3 k2 H$ _6 R" o9 Q4 f 另外,我在将带有表格的Htm(Html)转换为Txt文本中,试过多种方式,往往都难以保持表格对齐的格式,似乎除了很老的Netscape 4.05浏览器,现在流行的各种浏览器都不能正确地把网页存为保持表格格式的Txt文本,但Netscape上个世纪末被微软挤垮后再无踪影了, 虽然它无法支持今天的很多网页,但有这个优点,我仍然把它放在硬盘上备用。这个问题,不知各位大神有无高招?
" [* _0 t2 e. o: r( n* V$ }) h0 V# {( ^5 v# R' S( e; p
Yan Yu Ci Dian cut - Wei Zhi.txt 0.97M
& @6 H2 e; O8 u9 t% @" u谚语词典cut.pdf 61.11M
2 X* P$ Y' O0 x谚语词典cut_Apabi Reader.txt 2.98M
2 R! u- L; w, M4 K5 A" z谚语词典cut_Caj.txt 2.69M! F; {! k# ]6 h9 ]5 J
谚语词典cut_PDF2TXT.txt 1.93M
6 P" I* i: V8 A1 Q$ ^# P+ t1 d谚语词典cut_SumatraPDF.txt 1.03M/ ]2 x: j* b" O4 Y$ n. g
谚语词典cut_txtFormat.txt 434.37k
4 t* R( _/ U* h- m谚语词典cut_Wondershare PDF Converter.txt 2.91M7 V, G% } ^ X' ~
) Z% o. n3 A3 J( l1 x, v2 ~* J0 k
0 u5 l V0 N l+ s! d4 Q' p7 k2 U. D1 u; u; n% n
( ]+ r' R2 e6 c4 A0 J+ n! W2 G
/ e1 ?: c5 C( H3 @- W) l$ p |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
|