掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 4436|回复: 18

[工具] 维基咖啡

[复制链接]

该用户从未签到

发表于 2014-12-31 09:17:54 | 显示全部楼层 |阅读模式
本帖最后由 i-wiki 于 2015-1-1 23:22 编辑 " d% `/ ^- F: `2 G

1 ^/ v/ n# A* L, Y& T( |7 o& d来一杯维基咖啡(http://pan.baidu.com/s/1sjNn917)吧!  ?+ ]; B- }" f; A. d

7 W& N( u8 b5 @! @8 X以后,不管是凛凛寒冬还是炎炎夏日,无论原料来自哪个国家或语言,你都可以简单地研磨,品尝一下它的风味。
: k; ]  F% j% H8 t( [
6 \* y& x/ P4 x, j" bWikiCafe是什么?这是一个快速的维基格式文件解析程序,工作在Windows平台,可以方便地将Wikipedia、WikiSource等数据文件转换为符合MDict要求的文本本件。" ^: |7 \* q  {$ f2 Q
为什么叫这样一个名字?因为咖啡是优雅的,正如Wiki,咖啡是苦中作乐的,也如Wiki。咖啡不是生活的必需,只是生活的点缀。$ r. U( n, ]" Y" R- U7 \

4 b& }2 s) r8 @: g$ Y9 @优点:
9 U. P1 m) M; t0 w2 W1、快速。“Wiki”本身就是“快点”的意思。WikiCafe的速度很快,下载的Wiki数据文件无需解压,直接就可以处理,并且采用了多个线程并行工作,较充分地利用了CPU的效能。
9 A  {) M# L3 z" x2、美观。格式与之前的i-wiki引擎相似,外观接近于原Wiki页面。
5 T% p5 m# L( F3 O; J3、可将数学公式处理为图片。
4 r; t/ A7 s" |, t0 C( z) x4、可生成图文并茂的页面。
. S: V2 d4 S/ C. u' ^缺点:: G% l4 r' P/ s- [
1、未处理模板。所有的模板都保留下来了,不够好看,但保持了原有的风味。3 [$ Y% a, L( A) G/ b, }9 ]
2、因为是直接处理bz2压缩文件,所以页面中有些链接可能是无效的,就是Wiki网页中红色的链接。+ t4 h+ I( `; Q! E. F+ B
3、数学公式是不完美的,有些会出错。* S5 P' O5 |& ]( W6 p# S; @9 I4 j
...6 i& F7 F- ?+ E; e( N% }/ n

$ K4 o7 d+ p% ^7 g, W( p可是不管怎样,以Simple English Wikipedia为例,WikiCafe处理接近100MB的Dump文件只需要几分钟。如果仅生成文字版中文Wiki的词典,那在1个多小时也能够全部完成,与以往的引擎相比,耗费的时间可谓是天壤之别了。  g: a0 K3 |2 ^- |) u3 A) x% A

- _+ X/ Z( ?" J1 T: z% J组成程序:. g/ T! M$ }. c
WikiCafe.exe 主程序. s8 V" q8 ~4 `. W- f: G
math.exe     根据Tex公式生成相应图片- k/ G/ H( u3 y# L# B
Bin2Img.exe  图片集合文件处理程序4 X, g- R% b+ D* U3 d
Img2Bin.exe  将图片生成集合文件: Q$ F- M7 z& V, f" U
可用其他程序如Wiki2Touch处理下载图片后,由Img2Bin汇聚为集合文件。
+ c1 {( p0 N- S5 W9 d# h( u/ y/ Y; s6 K2 ]+ W
使用方法:
8 K1 `) w9 y7 S, p) `* a1、首先要从dumps.wikimedia.com上下载相应的数据文件。中文以zh开头,可用ctrl+f搜索。
: i8 N' Q5 A; i1 G( I5 A
8 V# h+ V" h+ ~! M9 j1 ]2、如果要生成图文版,先用wiki2touch处理,也可下载经过i-wiki处理过的图片集合文件;运行Bin2Img.exe,得到图片索引文件pic.ini。如仅需生成文字版,可直接转下一步。
/ Q) ~" q; ~$ \; a: j% w' R
0 m/ g2 C5 [$ c3、运行WikiCafe.exe,主要有以下参数:
3 c" k2 P$ o9 a, \.bz2文件    你所下载的Wiki数据文件,无需解压。
' b6 M% t/ _" [, K图片索引文件 如果想要生成图文版词典,你应该提供一个索引文件;如不提供,则不处理图片。0 W7 N' G" A5 M9 z. S4 R' u0 P
图片目录    图片等数据存放目录,也就是MdxBuilder中的mdd数据所在位置。公式图片就在此目录下,其他图片必须存放在该目录的pic文件夹中。如不指定或创建失败,则不处理包括公式在内的图片,公式以原Tex形式呈现。
' r. Y. X; T4 t文本文件    生成的目标,即MdxBuilder中的Source文件。
0 o- [6 M& F* }7 X! u. ?# @
- t7 q7 h; i0 D- _; }: }WikiCafe运行后将在程序目录中生成:
& D: Y5 E. f' H! w, e6 CWikiCafe.cfg  内容如下例子
$ ]7 J7 h8 ?( e/ \WikiBz2 = r:\simplewiki-20141222-pages-articles.xml.bz2
, j/ r/ w/ e; d* L( a7 qPicIni = d:\pic.ini1 r0 m+ C" Z" B: t
ImgDir = r:\data\& l! m% S5 L0 B9 G: e% k6 j
OutTxt = d:\s.txt
1 N" C4 I: k7 D以后再运行WikiCafe,如发现程序目录中有该文件,会询问是否加载。加载可节省人机交互的时间。4 G& c% c8 A2 D3 J7 G, E
math.txt    数学公式,供math.exe使用! Z9 x- o1 V5 y9 @0 M
images.txt  图片,供Bin2Img.exe使用
1 i- e* b) W) s7 [: `: Q, |: B4 N5 ~) J3 l. }8 j6 @) J0 G
在图片目录中生成:- J% f+ n1 ^. O) _
wiki.css
* I7 v: J7 K  X% i/ iwiki.png
) S$ n2 x' G) }: Xlink.png% B/ Q. L0 R7 s$ A4 _

7 f0 `8 F# |% h0 U, v# l. [! l0 u4、运行math.exe生成数学公式图片,主要参数:
  c2 P# z+ e/ p7 Y# S9 e& L. v6 Nmath.txt    公式文件,由WikiCafe处理后生成。
& _8 }- n, j8 L- C, ?4 t. k图片目录    可从WikiCafe.cfg中得到。
3 a" D( ~8 O* ^. @处理过程中会产生错误,无须理会屏幕中的错误信息,如出现异常中断运行,再次运行math.exe会从中断处继续进行处理。5 R& C6 [% s6 K2 T* ]- T
" o& w9 ]+ S2 T6 W
5、图文版还需要运行Bin2Img得到词典中的图片,参数有:
' V* f; ~- @& P" f! Q2 ?, I0 d图片集合文件 可下载经过i-wiki处理过的图片集合文件;/ I+ Y% I! W. N# ^& C& H
images.txt  图片文件名,由WikiCafe处理后生成。) t* Q: S" o- w* O* D
图片目录    可从WikiCafe.cfg中得到。( A  ~8 D6 E- z9 c2 M2 d* w
4 o7 D' V+ J2 L9 \9 d
6、运行MdxBuilder生成词典  J) e- `: _& b, [
% M; u' t: R3 `! Q3 h' h8 D

评分

1

查看全部评分

本帖被以下淘专辑推荐:

  • TA的每日心情
    开心
    2 小时前
  • 签到天数: 759 天

    [LV.10]以坛为家III

    发表于 2020-4-26 18:30:39 | 显示全部楼层
    本帖最后由 孤影 于 2020-4-26 09:37 编辑
    ) D1 G/ T! s* r9 ~! s! }  e5 m
    # l& D7 {3 [/ V
    - o" I2 s, m# T9 V+ {; p( A- B# Y传个附件,以作备份& n9 @2 w" N, u1 y- k* e. J
    ; q; W- o; }4 Z$ d6 |! k8 p
    2020-4-26- |  C# o4 R8 f& q0 K) |9 [# M# r5 d
    win10下不能运行,win7下一切正常
    ( R: v0 O- i9 R8 g

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    奋斗
    2018-4-16 08:43
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-4-25 01:11:04 | 显示全部楼层
    都打不开了,有没有新制作wikipedia的工具?

    该用户从未签到

    发表于 2016-8-5 16:10:11 | 显示全部楼层
    加油,支持了

    该用户从未签到

    发表于 2016-8-4 13:57:27 | 显示全部楼层
    大侠,Wiki2Touch等等这些工具有分享吗?

    该用户从未签到

    发表于 2015-5-7 14:53:48 | 显示全部楼层
    个人感觉目前的wiki 制作工具做出来的效果都没有官方Android客户端 Wikipedia Beta[url]http://www.coolapk.com/apk/org.wikipedia.beta[/url] 呈现出的效果好,尤其是制作出的表格在手机端显示不够美观,页面也不像客户端自适应的效果好。
    8 t# j: J" f) j8 _8 p: m3 A
    1 t/ d) O$ ~9 h( r1 W: b1 h我有几点想法:
    * u- O9 w- g/ i& b1.用Python或其他工具抓取wiki页面,可以得到有图的源文件;
    ! }6 g( Q  r) c5 L' a7 C2.词典制作时,页面排版可参考“Wikipedia Beta”的处理效果(这一点可以从手机客户端保存的离线页面数据入手)。% c$ l. m: m# G, U% P1 h

    . t, x" Z# a8 M2 w# |; G; Q' U
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    发表于 2015-1-28 11:11:23 | 显示全部楼层
    希望做出一个图文版的

    该用户从未签到

    发表于 2015-1-25 13:06:02 | 显示全部楼层
    速度那是相当的块,不到400m的bz2只用了十几分钟就转完了,排版还算过的去,唯一的遗憾就是模板了。没有处理的模板会有很多冗余的符号{ } 。时隔两年,感谢楼主回归,终于还是用上了,希望能继续完善

    该用户从未签到

    发表于 2015-1-23 18:25:21 | 显示全部楼层
    你们还活跃着... 我已经沉寂1年了.3 j" r7 V' a% v8 s" I$ i
    最近倒是打算把之前留的坑给填了.
    $ u) p! e6 ^) _% c$ ~" Q# N可惜我不会c, 帮不了fastwiki了.4 i; _! Q& _6 i6 b
    我现在只会bash, lua, python.

    该用户从未签到

     楼主| 发表于 2015-1-11 21:09:29 | 显示全部楼层
    fastwiki 发表于 2015-1-6 11:21
    5 ~: g* l3 z4 X! c: O还在搞 wiki 引擎啊?
    ' @. A" O4 W  t0 q/ z有兴趣可以来维护 fastwiki , 提供了一堆工具, 可以转换维基百科, 和自制词典,  基本 ...

    * o2 T/ e3 m; @& ?9 J2 d2 S好久没搞了,引擎和以前的相似,只是去掉了模板的处理部分,不再局限于中文Wiki。这个只是想帮助大家提高Wiki词典的生产效率。
    ; m- G/ u+ O$ Z0 Z$ G( T5 @) O老兄的Fastwiki很好,源码中有没有详细的注释?

    该用户从未签到

     楼主| 发表于 2015-1-11 20:58:37 | 显示全部楼层
    5 @. W! \( _' ]( K& J% P
    360往往宁可错杀三千也不放过一个。因为维基咖啡是用PowerBASIC编写的,而很多木马、病毒也是使用这一编程语言来编写,所以很多特征相似。
  • TA的每日心情
    难过
    2018-3-28 11:32
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    发表于 2014-12-31 09:41:13 | 显示全部楼层
    好东西,谢谢分享。

    该用户从未签到

    发表于 2015-1-6 09:14:27 | 显示全部楼层
    这是一个颠覆式的好东西

    该用户从未签到

    发表于 2015-1-6 09:15:31 | 显示全部楼层
    但是有木马

    该用户从未签到

    发表于 2015-1-6 11:21:34 | 显示全部楼层
    还在搞 wiki 引擎啊?
    1 P" F- y" D2 O0 a% E& S有兴趣可以来维护 fastwiki , 提供了一堆工具, 可以转换维基百科, 和自制词典,  基本由 C++ 写成.9 Q! e$ F% G, t! @8 z
    支持全文索引, 图片, 语音, 等等.% i( a6 ~5 i6 n" y

    2 F; W0 |7 k0 l, t2 H网页: https://fastwiki.me
    4 J* R- p3 O6 v3 h; I! G代码: https://github.com/qianshanhai/fastwiki6 j. v  L  E. {

    该用户从未签到

     楼主| 发表于 2015-1-6 19:50:53 | 显示全部楼层
    sexboy2003 发表于 2015-1-6 09:15. r0 I) w( K% g6 v7 [) z+ I
    但是有木马
    4 ~$ @# W0 x+ o" B& B( K- ]: C# B
    有压缩,但保证没有木马、病毒。

    该用户从未签到

    发表于 2015-1-11 13:20:47 | 显示全部楼层
    我一下载回来就报毒

    该用户从未签到

    发表于 2015-1-11 13:26:10 | 显示全部楼层

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-26 21:21 , Processed in 0.085506 second(s), 13 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表