维基百科的转换比是多少?
我想转法语维基百科,xml文件有4.15G,我想知道转换成的TXT文件有多大?因为我正在转,用的是wikitomdic 2.0,已经用了2个小时刚刚转了将近2G,如果文件太大,我今天就不转算了。电脑配置是T2390/2G。 比xml稍微少一些。 TXT是转换好了,不过在用MDXBUILD编译的时候出错,于是尝试用UE打开修复,那不是一般的慢啊,3.53G的文件用了20分钟才可以完全打开,而且还在C盘生成了7G多的临时文件。一Ctrl+H又是20分钟,Ctrl+G完了后再一次Ctrl+H又是20分钟,结果看了半天也没发现哪有问题,真是疯了!如果改正一个错都要1个小时的话,那不知道要到何年何月啊!有没有什么简单一点的办法?或者有没有什么更好的软件?
把TXT文件先分割成几个小文件然后修改好了之后再合并行得通吗? 有没有做过英文维基百科的指点一下啊,这么大个文件怎么处理? 我也没做过太大的。
我想这么大的文件应该是用tomeraider来读了。
http://infodisiac.com/Wikipedia/TomeRaider/Download/2007/WP_FR_(P)PC_TXT.tr3
这个是07年的
tomeraider的下载在其他版里。
https://pdawiki.com/forum/thread-916-1-1.html
[ 本帖最后由 发哥 于 2008-12-7 20:07 编辑 ] tomeraider的体积这么巨大啊。
不过我现在用winhex把TXT分为了36个文件,每个文件100M,现在已经完成了3个文件的修改,估计修改到第36个还是有可能的,愚公移山啊! 原帖由 zcm1019 于 2008-12-7 16:12 发表 https://pdawiki.com/images/common/back.gif
TXT是转换好了,不过在用MDXBUILD编译的时候出错,于是尝试用UE打开修复,那不是一般的慢啊,3.53G的文件用了20分钟才可以完全打开,而且还在C盘生成了7G多的临时文件。一Ctrl+H又是20分钟,Ctrl+G完了后再一次Ctrl+ ...
Ultraedit 可以设置不用生成临时文件的。用最新版的ultraedit貌似打开也快一点。
另外分开处理后合并是可以的。不过要注意文件末尾的换行符。 终于转换好了!太高兴了。最后mdx文件大小是0.98G。不过有个别词条没有解释,不知何故。 同志啊,法语维基百科在网上有下的啊 什么地方有下的啊?
这个是081201的数据库。 有英日法俄葡波意的吧,没有西语的,上次作了一个成功了,但不知道怎么做成精简版本的,700M太大了。。。
页:
[1]