|
本帖最后由 i-wiki 于 2013-4-9 08:59 编辑 , L2 i# J2 F, p2 n7 F$ g6 }% _
6 ~( {0 F2 x9 C7 x四月至今,发布了两个WJ百科词典,参见:, x) o+ n! s# b8 C& }: C8 E) i# H
https://pdawiki.com/forum/thread-8946-1-6.html7 y! R/ I" P( A3 |
https://pdawiki.com/forum/thread-9378-1-1.html
O' @4 K# M U你还期待i-wiki继续发布新的吗?0 X6 J' v" o! I6 {* n+ X" g/ E
谢谢大家的支持!可是,也许要让大家失望了,我不会再继续更新,除非有新的突破。# @4 F N$ \7 O8 M, D
所以,今后大家要自己制作词典了。古语有云:“授人鱼,不如授人以渔”。虽然i-wiki不再发布新的词典,但是他自制的中文维基引擎就要和大家分享了,你也一样可以制作出精美的维基词典!
7 _# d9 j: ?$ \" Q% I6 |' k! H S c2 y2 `7 t
之前也有坛友问到试用引擎的事,可是程序还不完善,不好意思拿出来和大家见面。经过这一段时间的修改,自我感觉基本可用了,加上现在程序编写也遇到了瓶颈,索性就放出来让大家一起来试用,在使用中逐步改进。
* {. ^: r% v( a3 }9 S" A0 W如果你能容忍6-13版的缺点,那么请接着往下看。0 x% t0 u* d; a9 c& [. p7 Y0 A
先上图,揭开新引擎的面纱。
2 W- a1 Z4 q, z% ?1 n; s4 @8 h- Q J2 m( C
! T: z2 }* S" C1 F: N+ d* \
( Z% m0 ~/ v1 K! d
0 x9 @, w9 G4 q$ `; J, O一、硬件要求:# i. f( l4 `2 n! |. N
配置总之越高越好。我自己制作2012-6-13版时用的笔记本是几年前的ThinkPad X200,CPU是酷睿II双核P8200(2.2GHz),内存2GB。大家现在的配置应该比这更好。
' ]4 \. F* ~$ n6 k: A/ X5 o8 n* n# H
二、软件环境:
) B, e. A1 t, @, y" ^% u在Windows XP中新引擎是绿色的,无需安装可直接运行。XP前的系统恐怕不行,之后的其他系统我没有测试,大家不妨试一试。
& Z( x1 f# K4 \4 V$ \" e5 k
+ ?/ r( }1 ~8 j" {三、操作步骤:9 I" C% x! k7 c4 R: R
1、先下载中文维基文档,解压为XML;
) G5 P. Q7 v4 j( G4 x" Z, f7 p+ P2、将此大文档分解为若干个100M左右的小文档;) k6 E2 W0 E; T6 `* E$ v
3、复制本程序到xml文档所在目录,或生成与本程序同名的.ini文本文件:
, U1 z: n8 s- ^' a+ U& J" e src=待处理的XML文件目录
$ b$ x0 g; `3 G+ N/ }& h" N; d tar=输出目录# b! A; x+ I( H7 e6 Q0 d
xml文件名列表" W" l0 b, c1 R% H8 ]/ l
4、运行本程序,处理完毕后可执行生成的.bat批处理文件将输出文件合并
5 b# u/ k9 ?8 y K0 g! K5、将生成的cfg文件复制到MdxBuilder目录
& j o7 S6 ?% v* f6、运行MdxBuilder.exe,制作词典。
1 w! e% Z' H6 W; M" f4 l" ~) ?' v$ c
四、简要说明:/ Q, g& D2 i9 O; ^1 _( g
A.本程序主要用于解析维基百科的Dump数据文件,生成符合MDict格式的Html文本文件。
0 R& B7 P' A# {' G+ g( j! G/ |2 s B.Dump数据文件必须分割为小于128MB的部分以便处理,超过128MB的文件会被忽略。$ f: |* m: E9 k( X4 L" ~ V
C.操作步骤是可选的,点击链接可执行相应的步骤,第6步包含了第5步的复制操作。2 d: H$ R \( A/ A
D.如直接点击处理按钮则相当于从第3步开始,即对程序所在目录下的XML文件转换。$ M+ u3 a }8 ~+ c' q$ ~8 E
E.本程序遵循Copyleft规范,详见维基百科中的相关条目。: Y- y0 Q; R9 ]. N% W, ]5 O
( k+ y- e% S* h% l新引擎在这里" ? E. b4 y. T/ s: V
' u& H( ^. z4 w4 f, J* ^; x6 {5 o' W; \
1 Y3 a$ d9 I; t! I- P) T
五、文件说明:9 Q' p% ]5 l' o4 c
下载后只有1个主文件W2T.exe,Examples目录是给大家测试用的。运行后会在程序目录生成:
4 p8 g# t9 {0 eE2C.ini 英中对照表。想到好多坛友都是英语高手,所以放出来让大家帮忙修改,如果看到条目中信息框中翻译得不好的、没有翻译的,大家就在这个表中修改、添加。
8 A9 J4 U+ c# M" Q) sW2T.ini 待处理XML文件列表。运行完毕会删除。
# C" l1 t4 I8 E6 v9 T6 D在源文件夹下,执行“分解”操作后会生成:(如Dumps解压文件为w.xml)2 ? I" v, k5 ]" M) _5 _3 S2 x& C: }
w01.xml <128MB的分块+ | f" m# x; B+ O/ A
w02.xml. ^( Z, }, z2 R, K1 s% r+ s5 ^
…2 }( C. m: D8 W: m' \
w.idx 索引文件。没有它也可以的,就按article中的关键字生成超链接,但是有些链接(在线维基中的红色关键字)实际没有相应条目。 x3 _/ y2 Z" P/ }; ]
在目标文件夹下,运行后会生成:# K# g. y$ H2 T9 V
w01.xml.txt% A: ] E; f6 Y3 R
w02.xml.txt
' @3 k" o8 `! Y…
, e2 y* s( U- Bwiki.bat 合并生成wiki.txt的批处理程序
; ?- d: R, y, p; s# W2 ]$ mmdxconfig.cfg
5 h4 @: q0 N. J/ r8 G5 e还有数据文件夹
$ {/ J' L. y8 E* H% q/ Mdata\
5 _4 L/ S! V; h# p6 U其中包含三个文件:
9 w; G* _2 m' j" r3 i5 i: ]5 Q) Swiki.css 层叠样式表,大家可以修改成你喜欢的格式。. }9 z8 _; ?* x: y+ a! ~
link.gif( Q5 j2 h, p( U& b) A9 F" L) C4 H' f
wiki.png
! M |% s2 w' H$ e! P" |' F和很多两字母命名的文件夹,里面是公式图片
7 I% M' y8 l% \( `
3 }, [3 d' R* X( K3 |! Z因为论坛里附件不能下载的原因,所以想尝试的朋友可以到网盘; n0 |9 F( n2 J! Q B; s
http://pan.baidu.com/share/link?shareid=253240&uk=19473610 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
2
查看全部评分
-
|