|
本帖最后由 i-wiki 于 2013-4-9 08:59 编辑 2 y' p, X0 `! N# w% F7 L' `: X
4 R) U( X) w# \) Z1 ?0 I
四月至今,发布了两个WJ百科词典,参见:2 F8 P" T+ T+ }% R/ C- j
https://pdawiki.com/forum/thread-8946-1-6.html& a0 K, [7 M/ _: r* }8 }
https://pdawiki.com/forum/thread-9378-1-1.html1 [3 c- K4 o$ {0 X! G$ ?
你还期待i-wiki继续发布新的吗?
3 v: U+ D, O& f s' ` Q" J) [谢谢大家的支持!可是,也许要让大家失望了,我不会再继续更新,除非有新的突破。
/ [6 J+ Z$ W i# N* B# ^$ q- K5 ^# K$ Q% {5 y所以,今后大家要自己制作词典了。古语有云:“授人鱼,不如授人以渔”。虽然i-wiki不再发布新的词典,但是他自制的中文维基引擎就要和大家分享了,你也一样可以制作出精美的维基词典!1 }2 F: {4 D0 Y
5 N7 p' }: \1 ^. w% J: `之前也有坛友问到试用引擎的事,可是程序还不完善,不好意思拿出来和大家见面。经过这一段时间的修改,自我感觉基本可用了,加上现在程序编写也遇到了瓶颈,索性就放出来让大家一起来试用,在使用中逐步改进。$ j4 D5 Y9 `8 y. ?* B7 v
如果你能容忍6-13版的缺点,那么请接着往下看。
: u9 U' X G8 A' B* S% ^先上图,揭开新引擎的面纱。5 z6 s- k; r) u$ A) ~7 T$ f' O
/ `2 r% X) Y" L- z6 o$ f
( J* B; O g+ K; X
% I# X* k+ b. K" @5 d
# t, m8 }" z0 o9 j5 o( _8 u9 c一、硬件要求:" f- P, O& y! \- W. ]3 U: Z% L
配置总之越高越好。我自己制作2012-6-13版时用的笔记本是几年前的ThinkPad X200,CPU是酷睿II双核P8200(2.2GHz),内存2GB。大家现在的配置应该比这更好。% o6 X- N: @6 z3 ?! F" o. D: V
3 x$ I6 P) S a3 P* I y+ H
二、软件环境:
1 y0 Q' i4 m! v" t在Windows XP中新引擎是绿色的,无需安装可直接运行。XP前的系统恐怕不行,之后的其他系统我没有测试,大家不妨试一试。
: m0 f) H0 [1 Q. C6 M* o( R4 J
) U* z7 M/ S3 Q- _5 X6 W三、操作步骤:5 V J. j5 c2 g" b# T- i) e% S
1、先下载中文维基文档,解压为XML;" U% c7 [0 [% l8 h6 o
2、将此大文档分解为若干个100M左右的小文档;
- p: }4 O4 z( d) V# r3、复制本程序到xml文档所在目录,或生成与本程序同名的.ini文本文件:3 L$ l1 E0 U* K* G! t1 y, Q1 R
src=待处理的XML文件目录1 E5 x9 R4 K6 I- L. x
tar=输出目录% t- ^- ^4 N, F4 q9 D$ n$ E
xml文件名列表
9 }. g7 @2 w" T; c! H0 A4、运行本程序,处理完毕后可执行生成的.bat批处理文件将输出文件合并
; P; C8 G- K: j# C4 s9 Y. d. A% ^. f5、将生成的cfg文件复制到MdxBuilder目录4 ?: E5 f* |- o/ S
6、运行MdxBuilder.exe,制作词典。
4 v4 W: L6 K2 b
+ ]1 }; }% I1 [2 s5 S- s四、简要说明:, `4 X$ z3 w( o
A.本程序主要用于解析维基百科的Dump数据文件,生成符合MDict格式的Html文本文件。
( U5 z1 [% ~) O" b- ?6 F* m B.Dump数据文件必须分割为小于128MB的部分以便处理,超过128MB的文件会被忽略。
- V: G7 L4 s# N9 ]) k$ ^7 l1 z C.操作步骤是可选的,点击链接可执行相应的步骤,第6步包含了第5步的复制操作。
2 L3 J; K3 c0 I0 ]! n$ H+ R8 E D.如直接点击处理按钮则相当于从第3步开始,即对程序所在目录下的XML文件转换。
{/ d; y8 |/ g; e; }4 V2 T( n E.本程序遵循Copyleft规范,详见维基百科中的相关条目。
7 P9 M! a% H, P3 V+ s3 v# W
' i: [( @' l$ Z6 J; i. }+ {新引擎在这里
$ q2 `" H! `! I0 B8 Z/ J) o: P5 F3 |* n W$ O; ]8 K7 p3 v9 x$ W
3 j2 U) {5 y5 n5 ]) Q
! p: \( k9 j( [: N9 X" o2 U# E( B
五、文件说明:
0 g0 v6 Z0 D5 s; t+ P下载后只有1个主文件W2T.exe,Examples目录是给大家测试用的。运行后会在程序目录生成:3 r9 f7 p: F5 N. Q2 M, b5 {6 d
E2C.ini 英中对照表。想到好多坛友都是英语高手,所以放出来让大家帮忙修改,如果看到条目中信息框中翻译得不好的、没有翻译的,大家就在这个表中修改、添加。) G. U; u. Y2 J% O( f
W2T.ini 待处理XML文件列表。运行完毕会删除。" Z9 }0 {9 `4 \/ w
在源文件夹下,执行“分解”操作后会生成:(如Dumps解压文件为w.xml)
* I4 C2 Z: d3 Q, h- Iw01.xml <128MB的分块& K- ]1 A& w4 @
w02.xml
6 O" Y! r# L- u, [( p8 R: R…) H2 u: r! P. E0 I
w.idx 索引文件。没有它也可以的,就按article中的关键字生成超链接,但是有些链接(在线维基中的红色关键字)实际没有相应条目。
/ _% N, O, b/ N7 s$ { X在目标文件夹下,运行后会生成:+ M; r5 R2 t6 L; v0 v! F/ J
w01.xml.txt# i# Z! K5 W* |* _0 Q( b- x# g7 n! D3 [7 |
w02.xml.txt* D$ R% K e% a6 B7 K% Z
…
6 r5 k6 Z: s! Q, a- dwiki.bat 合并生成wiki.txt的批处理程序' X j, Q& `- z k5 ^# {! }7 K3 P
mdxconfig.cfg+ ^$ T% f! G, ?7 t1 F c1 O0 g/ K
还有数据文件夹# S0 w a. V1 C( }- }+ b: V8 {: ^
data\
: H" `7 {! b7 |8 U* C其中包含三个文件:' s) i7 g3 y) Q
wiki.css 层叠样式表,大家可以修改成你喜欢的格式。 q5 s8 f: U- L% @
link.gif
, _6 k) ]7 P: lwiki.png
2 n; `9 j8 p. q" I" N4 K和很多两字母命名的文件夹,里面是公式图片" ]& _) X1 A( l' W; g
+ r) e5 Z+ s* [4 _/ _/ r
因为论坛里附件不能下载的原因,所以想尝试的朋友可以到网盘- N2 m$ `2 g n$ X1 b
http://pan.baidu.com/share/link?shareid=253240&uk=19473610 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
2
查看全部评分
-
|