|
本帖最后由 i-wiki 于 2013-4-9 08:59 编辑 : f9 n( L3 f$ |& G3 ~
' P, ]# l2 B$ m: ~" `
四月至今,发布了两个WJ百科词典,参见:
5 j7 p# K; ^. F8 vhttps://pdawiki.com/forum/thread-8946-1-6.html0 ?3 q5 L" }, q$ ^2 M
https://pdawiki.com/forum/thread-9378-1-1.html
: b( |1 R' i K, f% ?你还期待i-wiki继续发布新的吗?5 T9 H$ W7 R" M" n0 \1 G8 w
谢谢大家的支持!可是,也许要让大家失望了,我不会再继续更新,除非有新的突破。
8 x, p5 P6 e2 C+ C& ~3 s& d所以,今后大家要自己制作词典了。古语有云:“授人鱼,不如授人以渔”。虽然i-wiki不再发布新的词典,但是他自制的中文维基引擎就要和大家分享了,你也一样可以制作出精美的维基词典!
! @* M5 R# \1 H! `% D+ Y
! e. I' L# h" q之前也有坛友问到试用引擎的事,可是程序还不完善,不好意思拿出来和大家见面。经过这一段时间的修改,自我感觉基本可用了,加上现在程序编写也遇到了瓶颈,索性就放出来让大家一起来试用,在使用中逐步改进。
# I% e; h2 c: [) h2 q1 ~如果你能容忍6-13版的缺点,那么请接着往下看。4 X" M" L# C Y4 w
先上图,揭开新引擎的面纱。, h4 a& W& W3 P* f6 F
) ~; r. v9 Y' R+ k0 I+ p r: q& D3 G3 R1 f9 l. W, j; g9 Y
; t' ^0 D8 n6 |1 L
! Z/ f: j# f9 N! J- S" g一、硬件要求:
& s9 i7 c* d4 F1 k配置总之越高越好。我自己制作2012-6-13版时用的笔记本是几年前的ThinkPad X200,CPU是酷睿II双核P8200(2.2GHz),内存2GB。大家现在的配置应该比这更好。& w1 \( b5 k' q& L( B8 w: T
# E1 I6 R3 ?5 d- E6 j二、软件环境:
' c+ j& l- f5 [$ A" h* b1 @在Windows XP中新引擎是绿色的,无需安装可直接运行。XP前的系统恐怕不行,之后的其他系统我没有测试,大家不妨试一试。
+ V. Z2 A, A" B4 W% `: W, Q8 v4 d4 Q% r, G
三、操作步骤:
3 \. u5 Y; V* g& M: Z( Q3 {8 }: R- [1、先下载中文维基文档,解压为XML; ^, T7 V5 e$ }; W
2、将此大文档分解为若干个100M左右的小文档;
M! x F0 V/ k2 V) S3、复制本程序到xml文档所在目录,或生成与本程序同名的.ini文本文件:3 E! F. U6 `, ?/ N3 U) S
src=待处理的XML文件目录
4 Z/ y0 K/ M e/ [8 p# A/ i tar=输出目录
" Q6 P. r, t. m. G3 Z* ^# r) D8 Q4 v xml文件名列表
) b0 O. g' ^* I( e$ m4、运行本程序,处理完毕后可执行生成的.bat批处理文件将输出文件合并, N' ^3 ^. ^. s$ o
5、将生成的cfg文件复制到MdxBuilder目录
# g7 R3 J1 f8 a1 J* I( g% I& C, R6、运行MdxBuilder.exe,制作词典。& z _9 C' q& l4 F- d/ Y
, t O3 e, \# g+ ~5 c; s四、简要说明:( M! f' B: o! ]
A.本程序主要用于解析维基百科的Dump数据文件,生成符合MDict格式的Html文本文件。
# U/ b/ ~' _! R. B3 q! l) Q, p B.Dump数据文件必须分割为小于128MB的部分以便处理,超过128MB的文件会被忽略。- S6 n; n, u6 A
C.操作步骤是可选的,点击链接可执行相应的步骤,第6步包含了第5步的复制操作。* T( c* [! v: C
D.如直接点击处理按钮则相当于从第3步开始,即对程序所在目录下的XML文件转换。
; I1 e4 [3 ] I5 ~. v; [, N E.本程序遵循Copyleft规范,详见维基百科中的相关条目。 |. g+ x! p/ a- P
[0 ] l9 E0 M新引擎在这里- G5 Z9 A {8 O$ T, ?
( b+ d" m4 g6 m* c6 S P; f6 e
' u- a1 e" t* p1 v1 ?8 T2 q- F) ~4 p8 w; }6 W. w# w' h! y
五、文件说明:5 ?6 G0 P2 @9 }# r! U# k+ S1 Y
下载后只有1个主文件W2T.exe,Examples目录是给大家测试用的。运行后会在程序目录生成:
; z% y# j, ~0 S! b; t: sE2C.ini 英中对照表。想到好多坛友都是英语高手,所以放出来让大家帮忙修改,如果看到条目中信息框中翻译得不好的、没有翻译的,大家就在这个表中修改、添加。
1 v( Q+ w7 m* o3 G4 k$ b; dW2T.ini 待处理XML文件列表。运行完毕会删除。
/ w/ T2 C4 L8 [, P在源文件夹下,执行“分解”操作后会生成:(如Dumps解压文件为w.xml)
$ D1 _; E& P- r) {# y4 vw01.xml <128MB的分块( C& ?( X" H" p
w02.xml
E7 C& `- n' G& \5 C8 ~…
* \" W: @: Q- V \w.idx 索引文件。没有它也可以的,就按article中的关键字生成超链接,但是有些链接(在线维基中的红色关键字)实际没有相应条目。' D' `" l/ `( M5 @4 a- n. z( Q
在目标文件夹下,运行后会生成:
, D ~5 H! n8 g" f" m( n# i# {w01.xml.txt
; K2 o% k! b% s1 J* pw02.xml.txt+ M& Y4 F- h& b7 n$ A
…
' F( q- m+ U8 ~* I* h7 Y6 Rwiki.bat 合并生成wiki.txt的批处理程序
; |% G e8 z7 ~3 Wmdxconfig.cfg
( z8 D Y* i# ^7 t1 v还有数据文件夹
. a) W1 y/ X5 Adata\
( [2 p6 A9 r z. |0 V其中包含三个文件:
3 M+ y8 E+ {+ r9 P8 e' cwiki.css 层叠样式表,大家可以修改成你喜欢的格式。
2 g: d: l! J" K, _$ i4 f& K0 jlink.gif
3 H6 D7 e' ^* L+ D7 Fwiki.png
8 ]- w: f; N5 ]1 l3 Q: q' l% t和很多两字母命名的文件夹,里面是公式图片
4 a$ Q: f9 a) B9 Y" f) I. K f
8 j O6 {1 j6 Y( M- x, }/ [2 z因为论坛里附件不能下载的原因,所以想尝试的朋友可以到网盘2 K1 w# o7 v3 w8 m7 d. A
http://pan.baidu.com/share/link?shareid=253240&uk=19473610 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
2
查看全部评分
-
|