TA的每日心情 | 慵懒 1 小时前 |
---|
签到天数: 1721 天 [LV.Master]伴坛终老
|
发表于 2020-8-4 04:40:53
|
显示全部楼层
eeshu 发表于 2020-8-3 10:26
1 m4 Z. K: B+ s# q已经上传链接:https://pan.baidu.com/s/1sapNgJXdDx6cRueVIKVP3g
, i2 ~* _2 ]7 y& P5 ^( T提取码:kz89,请试试你的各种法宝。 ... 4 G+ \, A6 _6 j, |" I9 {1 N
楼主试过的acrobat、foxit和smallpdf软件,我就没有试,我用了如下软件:Apabi Reader、Caj、SumatraPDF、Calibre、PDF2TXT、txtFormat和Wondershare PDF Converter,前三种和最后一种成功转换,Calibre、PDF2TXT和txtFormat失败——根本没有汉字!文件也是最小的三种;原文件和转换后的文本文件列于下,文本压缩包见附件。 W! R, h8 J+ W: o$ {" g
从转换效果来看,Apabi Reader和SumatraPDF最好,基本与原文一致,Caj次之,Wondershare PDF Converter转换的每个汉字之间均有空格。Caj是这几个软件中唯一能正确双栏显示Pdf的,其他几个都只显示单栏;Calibre名气不小,而且支持的格式最多,但这次失败了;PDF2TXT批量转换较快,但经常有乱码。
+ r) x5 b4 X" D* f: X1 d 另外,我在将带有表格的Htm(Html)转换为Txt文本中,试过多种方式,往往都难以保持表格对齐的格式,似乎除了很老的Netscape 4.05浏览器,现在流行的各种浏览器都不能正确地把网页存为保持表格格式的Txt文本,但Netscape上个世纪末被微软挤垮后再无踪影了, 虽然它无法支持今天的很多网页,但有这个优点,我仍然把它放在硬盘上备用。这个问题,不知各位大神有无高招?2 e7 ]" J0 u0 n: I0 \( L6 @, t7 ^
: O0 l1 b% B" ?* ~* Z' I+ fYan Yu Ci Dian cut - Wei Zhi.txt 0.97M- X+ R, X& ^; u- _
谚语词典cut.pdf 61.11M2 z. T4 c8 M8 n* H8 k# k$ f8 i' S
谚语词典cut_Apabi Reader.txt 2.98M
+ ]# x$ H# {9 k3 S谚语词典cut_Caj.txt 2.69M! [# z9 [* i( M( B# x
谚语词典cut_PDF2TXT.txt 1.93M0 \6 r- l8 c' [" E
谚语词典cut_SumatraPDF.txt 1.03M( @) e9 U8 ^ a H* _
谚语词典cut_txtFormat.txt 434.37k
7 D+ h- C2 L! {" d# X谚语词典cut_Wondershare PDF Converter.txt 2.91M# e3 b' v: ~4 w! e
$ w9 k* e; ^# w% O5 @
* l/ w' e& n0 z3 b! I. l: G! b2 H$ K& y4 o3 P
& c, j, P' a( a- z' l1 z5 _2 d4 E7 ~- u$ Q3 ^% v9 [# a7 E8 L: _
2 G% W! C0 e+ n/ R* l1 N6 b |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
|