zcm1019 发表于 2008-12-6 16:20:44

维基百科的转换比是多少?

我想转法语维基百科,xml文件有4.15G,我想知道转换成的TXT文件有多大?因为我正在转,用的是wikitomdic 2.0,已经用了2个小时刚刚转了将近2G,如果文件太大,我今天就不转算了。电脑配置是T2390/2G。

发哥 发表于 2008-12-6 20:36:41

比xml稍微少一些。

zcm1019 发表于 2008-12-7 16:12:22

TXT是转换好了,不过在用MDXBUILD编译的时候出错,于是尝试用UE打开修复,那不是一般的慢啊,3.53G的文件用了20分钟才可以完全打开,而且还在C盘生成了7G多的临时文件。一Ctrl+H又是20分钟,Ctrl+G完了后再一次Ctrl+H又是20分钟,结果看了半天也没发现哪有问题,真是疯了!如果改正一个错都要1个小时的话,那不知道要到何年何月啊!

有没有什么简单一点的办法?或者有没有什么更好的软件?

把TXT文件先分割成几个小文件然后修改好了之后再合并行得通吗?

zcm1019 发表于 2008-12-7 16:47:41

有没有做过英文维基百科的指点一下啊,这么大个文件怎么处理?

发哥 发表于 2008-12-7 20:02:36

我也没做过太大的。
我想这么大的文件应该是用tomeraider来读了。
http://infodisiac.com/Wikipedia/TomeRaider/Download/2007/WP_FR_(P)PC_TXT.tr3
这个是07年的
tomeraider的下载在其他版里。
https://pdawiki.com/forum/thread-916-1-1.html

[ 本帖最后由 发哥 于 2008-12-7 20:07 编辑 ]

zcm1019 发表于 2008-12-7 20:27:50

tomeraider的体积这么巨大啊。

不过我现在用winhex把TXT分为了36个文件,每个文件100M,现在已经完成了3个文件的修改,估计修改到第36个还是有可能的,愚公移山啊!

rayman 发表于 2008-12-7 21:58:57

原帖由 zcm1019 于 2008-12-7 16:12 发表 https://pdawiki.com/images/common/back.gif
TXT是转换好了,不过在用MDXBUILD编译的时候出错,于是尝试用UE打开修复,那不是一般的慢啊,3.53G的文件用了20分钟才可以完全打开,而且还在C盘生成了7G多的临时文件。一Ctrl+H又是20分钟,Ctrl+G完了后再一次Ctrl+ ...

Ultraedit 可以设置不用生成临时文件的。用最新版的ultraedit貌似打开也快一点。
另外分开处理后合并是可以的。不过要注意文件末尾的换行符。

zcm1019 发表于 2008-12-7 23:13:42

终于转换好了!太高兴了。最后mdx文件大小是0.98G。不过有个别词条没有解释,不知何故。

B205FB 发表于 2008-12-8 01:52:28

同志啊,法语维基百科在网上有下的啊

zcm1019 发表于 2008-12-8 14:52:47

什么地方有下的啊?

这个是081201的数据库。

john8099577 发表于 2008-12-9 20:03:36

有英日法俄葡波意的吧,没有西语的,上次作了一个成功了,但不知道怎么做成精简版本的,700M太大了。。。
页: [1]
查看完整版本: 维基百科的转换比是多少?