|
本帖最后由 i-wiki 于 2015-1-1 23:22 编辑
$ H) e2 `/ k/ p h# B' _
, N5 [" r% L8 S5 s! U0 H0 f来一杯维基咖啡(http://pan.baidu.com/s/1sjNn917)吧!
/ o. }" L1 Z" i* `% x0 p) s- z$ C* T/ {3 |8 ]+ I! e$ n% Z
以后,不管是凛凛寒冬还是炎炎夏日,无论原料来自哪个国家或语言,你都可以简单地研磨,品尝一下它的风味。
A8 E9 |1 {* [" w0 K/ p3 C1 t8 b
% ~+ S& V8 v- L# lWikiCafe是什么?这是一个快速的维基格式文件解析程序,工作在Windows平台,可以方便地将Wikipedia、WikiSource等数据文件转换为符合MDict要求的文本本件。
8 {, c9 P! P3 k/ d为什么叫这样一个名字?因为咖啡是优雅的,正如Wiki,咖啡是苦中作乐的,也如Wiki。咖啡不是生活的必需,只是生活的点缀。7 f G& C( E% a. t. O* p/ u
: ` \; k) Z, ?# u' h% N优点:+ `' f: `* K l: K5 w8 ?6 A
1、快速。“Wiki”本身就是“快点”的意思。WikiCafe的速度很快,下载的Wiki数据文件无需解压,直接就可以处理,并且采用了多个线程并行工作,较充分地利用了CPU的效能。
- N% J, }) p6 ~0 v; V, T, {2、美观。格式与之前的i-wiki引擎相似,外观接近于原Wiki页面。
# [5 Z& |/ O8 J! q( d7 N3、可将数学公式处理为图片。
2 i( B: l" V7 D) A& |4、可生成图文并茂的页面。
: y0 r; y1 q5 O0 \缺点:
A) Y' R* e. V8 g% l! V* x1、未处理模板。所有的模板都保留下来了,不够好看,但保持了原有的风味。 h1 c9 ^. W4 i' M. \- J. V
2、因为是直接处理bz2压缩文件,所以页面中有些链接可能是无效的,就是Wiki网页中红色的链接。
& f# d) f Y3 p5 Z9 w" r6 d3、数学公式是不完美的,有些会出错。8 L7 C' j2 _5 n4 |/ W# v2 I' z
...( u2 a( _: s) @) N( k/ M; l) b
# l! b5 J; J5 x3 z可是不管怎样,以Simple English Wikipedia为例,WikiCafe处理接近100MB的Dump文件只需要几分钟。如果仅生成文字版中文Wiki的词典,那在1个多小时也能够全部完成,与以往的引擎相比,耗费的时间可谓是天壤之别了。 ~6 P. V+ `3 M( ]& V$ G9 o8 A u: }
3 c% k$ w0 A5 h; l
组成程序:/ D% Q0 ^% F8 m4 X
WikiCafe.exe 主程序 V( t# Q. X/ _7 k* u) T2 e
math.exe 根据Tex公式生成相应图片/ j5 ^9 R# j1 N6 \( o. k% f! E
Bin2Img.exe 图片集合文件处理程序7 {! }6 X+ `/ n' ?5 v
Img2Bin.exe 将图片生成集合文件
9 W' K/ u' V, g9 w. a9 E7 A! g可用其他程序如Wiki2Touch处理下载图片后,由Img2Bin汇聚为集合文件。) ~6 _2 }( D. m# p: S
: m" g( |3 r6 `4 p! S# g% ]/ s使用方法:
! J- c( s' {5 X0 P. |6 s% O& R) Z# l1、首先要从dumps.wikimedia.com上下载相应的数据文件。中文以zh开头,可用ctrl+f搜索。
8 E& M( p U: P ]* g7 f$ o9 V
. A0 D! t" ~; r' J- ^8 j( w8 R2、如果要生成图文版,先用wiki2touch处理,也可下载经过i-wiki处理过的图片集合文件;运行Bin2Img.exe,得到图片索引文件pic.ini。如仅需生成文字版,可直接转下一步。
b$ ]3 h1 x$ |* K1 d8 D6 E6 c( W) q4 J, _7 T# t7 R2 g! D
3、运行WikiCafe.exe,主要有以下参数:
+ U! v' c$ Y2 @; z.bz2文件 你所下载的Wiki数据文件,无需解压。
# V9 H& Z0 H( H$ f; J图片索引文件 如果想要生成图文版词典,你应该提供一个索引文件;如不提供,则不处理图片。
/ i4 Q6 h- n. m) j* O图片目录 图片等数据存放目录,也就是MdxBuilder中的mdd数据所在位置。公式图片就在此目录下,其他图片必须存放在该目录的pic文件夹中。如不指定或创建失败,则不处理包括公式在内的图片,公式以原Tex形式呈现。. M8 {! p# M7 E* s/ z" i
文本文件 生成的目标,即MdxBuilder中的Source文件。
2 J' F8 S5 D" K" `/ r/ B, Z8 A8 G& f. D* d, [
WikiCafe运行后将在程序目录中生成:% v J: F" d& _6 M
WikiCafe.cfg 内容如下例子( ^. L4 t# v6 t
WikiBz2 = r:\simplewiki-20141222-pages-articles.xml.bz2; m2 R5 U7 s; Z. M1 R1 [1 G1 [& h4 P
PicIni = d:\pic.ini
3 I! I% ?% n# q5 L! s9 `( Z- vImgDir = r:\data\
. [5 \/ ?* {4 m/ N4 W; d( dOutTxt = d:\s.txt
, t7 q1 z6 a. n% H6 Y; {) ~1 T. V7 F以后再运行WikiCafe,如发现程序目录中有该文件,会询问是否加载。加载可节省人机交互的时间。
4 U7 [( p+ a4 V* N: cmath.txt 数学公式,供math.exe使用0 b* m; K; j, |) T1 n
images.txt 图片,供Bin2Img.exe使用
- F6 p- f$ T% l/ m5 K$ a; a) s% o u& m
在图片目录中生成:; ~6 C* Y/ ^& K0 s
wiki.css# V$ z2 o/ ~0 T/ x2 J
wiki.png# ~- T( F) p/ v! s8 y' o. Q# w" ^
link.png
: T8 d, G& g* u1 l% m* [/ d9 Z
4 z# v+ _3 L- b! k4、运行math.exe生成数学公式图片,主要参数:
* G/ W# o6 k8 cmath.txt 公式文件,由WikiCafe处理后生成。& h% x0 l @! Z2 R2 ]5 F
图片目录 可从WikiCafe.cfg中得到。
( b# \! V; @" `' P5 Z处理过程中会产生错误,无须理会屏幕中的错误信息,如出现异常中断运行,再次运行math.exe会从中断处继续进行处理。3 n# C+ V6 ~& a, y
& F8 T. \" w q9 n' e2 w
5、图文版还需要运行Bin2Img得到词典中的图片,参数有:
7 ~5 g7 V5 L2 c( |; \图片集合文件 可下载经过i-wiki处理过的图片集合文件;. @/ U7 N1 Z. p8 B5 v4 C' p; V
images.txt 图片文件名,由WikiCafe处理后生成。6 F E; r6 _5 Z; B. F
图片目录 可从WikiCafe.cfg中得到。) X9 O% |8 V1 x
) j7 s4 ^4 c! g) n9 G% c2 e- z6、运行MdxBuilder生成词典& h# W; O1 r$ S+ ~ w0 q
5 j# P2 Z' `3 f( k" w- X
|
评分
-
1
查看全部评分
-
|