|
本帖最后由 i-wiki 于 2013-4-9 08:59 编辑 : p& o- X+ b0 V
% t, j- [7 n' ]四月至今,发布了两个WJ百科词典,参见:
" p- @. U1 B3 u% j2 ]0 G7 X8 Ghttps://pdawiki.com/forum/thread-8946-1-6.html4 x& F# _8 ] q- M9 }- \+ j
https://pdawiki.com/forum/thread-9378-1-1.html$ D2 v5 W& L' L0 T! A4 E# T
你还期待i-wiki继续发布新的吗?8 I. h+ |" h4 P1 Q: K% W+ [- J
谢谢大家的支持!可是,也许要让大家失望了,我不会再继续更新,除非有新的突破。; I$ |7 |) X" k- m0 y: q; o/ S
所以,今后大家要自己制作词典了。古语有云:“授人鱼,不如授人以渔”。虽然i-wiki不再发布新的词典,但是他自制的中文维基引擎就要和大家分享了,你也一样可以制作出精美的维基词典!0 u/ l: q6 i. [' B) g5 M4 s+ f
5 H# O, ^4 J S4 X之前也有坛友问到试用引擎的事,可是程序还不完善,不好意思拿出来和大家见面。经过这一段时间的修改,自我感觉基本可用了,加上现在程序编写也遇到了瓶颈,索性就放出来让大家一起来试用,在使用中逐步改进。0 r5 ~; z$ Z5 H+ ] Z( c
如果你能容忍6-13版的缺点,那么请接着往下看。0 b" ?2 ~$ S0 o" F( _
先上图,揭开新引擎的面纱。
, r a# M& x7 [; H8 H7 }
. ?4 _" |% v; K- f
/ \) O* q, \; o: Z
$ c6 w% I' u# a- Q2 ~4 X$ c |+ ~6 a( j Z5 x$ @' A+ d" g: U- i
一、硬件要求:$ P; ]6 n: x+ N% U: T) A1 i
配置总之越高越好。我自己制作2012-6-13版时用的笔记本是几年前的ThinkPad X200,CPU是酷睿II双核P8200(2.2GHz),内存2GB。大家现在的配置应该比这更好。# P% H( h, ~' ]
; V2 W% J9 C1 N. _+ a* m二、软件环境:
$ g4 K$ T+ y6 \- [" f2 `8 P& u在Windows XP中新引擎是绿色的,无需安装可直接运行。XP前的系统恐怕不行,之后的其他系统我没有测试,大家不妨试一试。
8 j/ Q: O) v# u$ ?: P0 { i6 d8 c/ {6 c0 _
三、操作步骤:
! S" I) O: q9 f9 b3 V% _1、先下载中文维基文档,解压为XML;3 Y$ l8 h& p1 Y* L
2、将此大文档分解为若干个100M左右的小文档;
9 p0 [+ {# f* f# M1 G3、复制本程序到xml文档所在目录,或生成与本程序同名的.ini文本文件:- X( B! f0 k+ I8 Z& G: P% u
src=待处理的XML文件目录
! G6 @& O) s# J' Z6 R: I tar=输出目录
) V- q3 V) E; A7 | xml文件名列表
/ ?" K3 J5 }4 r2 q1 e4、运行本程序,处理完毕后可执行生成的.bat批处理文件将输出文件合并: D6 u6 ?3 C! l: a5 {: C2 l
5、将生成的cfg文件复制到MdxBuilder目录
5 z, Y7 E/ l% R$ @6、运行MdxBuilder.exe,制作词典。! U% Z: s5 z( W
6 w: W/ ~4 D, S: e6 x
四、简要说明:
$ w0 _" p" a$ ^5 d4 x# z/ y# m5 K A.本程序主要用于解析维基百科的Dump数据文件,生成符合MDict格式的Html文本文件。9 j9 o, x8 C* p% U
B.Dump数据文件必须分割为小于128MB的部分以便处理,超过128MB的文件会被忽略。# z$ E2 g0 {9 B5 t) m2 P: g
C.操作步骤是可选的,点击链接可执行相应的步骤,第6步包含了第5步的复制操作。% T' Y" g% q* ]0 Q5 H% s
D.如直接点击处理按钮则相当于从第3步开始,即对程序所在目录下的XML文件转换。
: ~( Q$ k0 u+ G* o& J# C' k E.本程序遵循Copyleft规范,详见维基百科中的相关条目。
$ z; Z, h2 P, w* @( L/ u7 R: B
新引擎在这里: ^) z" D/ r/ Y8 O+ B$ D7 `
$ l7 ~ c* p5 z! F9 V
% d/ Q8 l- {, v1 \! w8 ]9 p& W5 Q+ b( c# p
五、文件说明:
( x3 L- F2 h! t8 J下载后只有1个主文件W2T.exe,Examples目录是给大家测试用的。运行后会在程序目录生成:
# Y3 V/ I3 S: B* DE2C.ini 英中对照表。想到好多坛友都是英语高手,所以放出来让大家帮忙修改,如果看到条目中信息框中翻译得不好的、没有翻译的,大家就在这个表中修改、添加。* f4 L7 Q0 ]/ l( q8 U8 Q0 p
W2T.ini 待处理XML文件列表。运行完毕会删除。
. {& H5 A. G" F; j9 F8 |+ e在源文件夹下,执行“分解”操作后会生成:(如Dumps解压文件为w.xml)
/ q2 k4 m+ ]- Ww01.xml <128MB的分块
& h! E F" _; Q* ~w02.xml `9 V# R6 ~) x2 j4 j& ]" n* @
…
. ^9 K, U& p6 d' F# y0 sw.idx 索引文件。没有它也可以的,就按article中的关键字生成超链接,但是有些链接(在线维基中的红色关键字)实际没有相应条目。
% O1 p2 j% n' M! b) L在目标文件夹下,运行后会生成:" t8 H7 D# r. f
w01.xml.txt
# X0 F9 h/ i) E, C/ X1 pw02.xml.txt s5 q8 G- f0 F
…
' z% a v5 @( I8 Rwiki.bat 合并生成wiki.txt的批处理程序& a8 M, F' i* {2 N( H" [6 M! B2 U
mdxconfig.cfg3 z$ o/ l5 ]8 w" J
还有数据文件夹
! F$ W4 N* @( J3 @' Qdata\" \9 E) Q: h& r8 N, R
其中包含三个文件:
. ?8 G7 F; A. J3 G4 ewiki.css 层叠样式表,大家可以修改成你喜欢的格式。
, J2 m V. o2 X4 G" n# Rlink.gif, o! |6 Z& C9 x: L2 g. h
wiki.png- _* v0 H/ ] a& n4 Y
和很多两字母命名的文件夹,里面是公式图片
: ~2 |+ _$ j- H+ Q6 Y. d7 c
I! u; I3 x% d' E因为论坛里附件不能下载的原因,所以想尝试的朋友可以到网盘5 K) {! I4 l O1 z6 D
http://pan.baidu.com/share/link?shareid=253240&uk=19473610 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
2
查看全部评分
-
|