TA的每日心情 | 慵懒 昨天 07:23 |
---|
签到天数: 1724 天 [LV.Master]伴坛终老
|
发表于 2020-8-4 04:40:53
|
显示全部楼层
eeshu 发表于 2020-8-3 10:264 K8 o3 Z, {- [ Z9 C
已经上传链接:https://pan.baidu.com/s/1sapNgJXdDx6cRueVIKVP3g ; @( j4 v1 Y0 Y, {4 [0 G
提取码:kz89,请试试你的各种法宝。 ... $ C# X- t! M' d+ \+ I; H
楼主试过的acrobat、foxit和smallpdf软件,我就没有试,我用了如下软件:Apabi Reader、Caj、SumatraPDF、Calibre、PDF2TXT、txtFormat和Wondershare PDF Converter,前三种和最后一种成功转换,Calibre、PDF2TXT和txtFormat失败——根本没有汉字!文件也是最小的三种;原文件和转换后的文本文件列于下,文本压缩包见附件。 d" o/ q. {% o0 n# d
从转换效果来看,Apabi Reader和SumatraPDF最好,基本与原文一致,Caj次之,Wondershare PDF Converter转换的每个汉字之间均有空格。Caj是这几个软件中唯一能正确双栏显示Pdf的,其他几个都只显示单栏;Calibre名气不小,而且支持的格式最多,但这次失败了;PDF2TXT批量转换较快,但经常有乱码。
1 T& T+ F% L& x2 E 另外,我在将带有表格的Htm(Html)转换为Txt文本中,试过多种方式,往往都难以保持表格对齐的格式,似乎除了很老的Netscape 4.05浏览器,现在流行的各种浏览器都不能正确地把网页存为保持表格格式的Txt文本,但Netscape上个世纪末被微软挤垮后再无踪影了, 虽然它无法支持今天的很多网页,但有这个优点,我仍然把它放在硬盘上备用。这个问题,不知各位大神有无高招?- T/ h1 e' B: S) H% I
) g. j+ T) g4 ?7 z8 I1 uYan Yu Ci Dian cut - Wei Zhi.txt 0.97M; K4 Q7 j! {+ G, c
谚语词典cut.pdf 61.11M
' }' I& \% v; f( h' L! s谚语词典cut_Apabi Reader.txt 2.98M. C& s6 S0 H7 D; N; L' z
谚语词典cut_Caj.txt 2.69M
% `, \) W0 B1 m" {9 m# M7 {% Z谚语词典cut_PDF2TXT.txt 1.93M
3 y8 s) E7 {: x/ X谚语词典cut_SumatraPDF.txt 1.03M2 i5 F! u1 }. Q }1 i
谚语词典cut_txtFormat.txt 434.37k
9 i# T+ d1 w" C @+ t) k谚语词典cut_Wondershare PDF Converter.txt 2.91M1 K1 |/ b- B3 x1 n: J' {( V; S. Y+ Z
. o# j* S* W& O& [6 L1 E8 X6 K+ `" r; Y6 }# r1 G! R8 S
" V! C' w, n4 L/ E& Y0 I( G- u
. _5 j% E& c9 A; ]3 v' n5 X/ j+ f- c% ~0 ~; Q& G, C( M. |/ v
; O& V& R! D( {( k |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
|