掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 4437|回复: 18

[工具] 维基咖啡

[复制链接]

该用户从未签到

发表于 2014-12-31 09:17:54 | 显示全部楼层 |阅读模式
本帖最后由 i-wiki 于 2015-1-1 23:22 编辑 2 c; K' C% Z5 i7 W) \* V4 C" M/ |

3 }, X) z9 f" Z& E8 _; \来一杯维基咖啡(http://pan.baidu.com/s/1sjNn917)吧!
3 A9 z; n- J/ d: A. y, I8 q2 j
1 u4 l* f/ R1 a- o8 O以后,不管是凛凛寒冬还是炎炎夏日,无论原料来自哪个国家或语言,你都可以简单地研磨,品尝一下它的风味。
. a; L3 @# o% ~1 A5 j
$ h1 ?, K& R: ]  {. mWikiCafe是什么?这是一个快速的维基格式文件解析程序,工作在Windows平台,可以方便地将Wikipedia、WikiSource等数据文件转换为符合MDict要求的文本本件。
0 f( S0 B; W8 O7 e& e- {为什么叫这样一个名字?因为咖啡是优雅的,正如Wiki,咖啡是苦中作乐的,也如Wiki。咖啡不是生活的必需,只是生活的点缀。
, y2 ^5 ]! r" v' L6 U' S
  g. e: {: C: Q6 i# b! Y- S8 `! }优点:
: D8 \& ^' Z- e# x1、快速。“Wiki”本身就是“快点”的意思。WikiCafe的速度很快,下载的Wiki数据文件无需解压,直接就可以处理,并且采用了多个线程并行工作,较充分地利用了CPU的效能。- X, T$ e' \, ]. k( D! z" x5 |
2、美观。格式与之前的i-wiki引擎相似,外观接近于原Wiki页面。
7 ]$ S% Y0 o5 L, P. @3、可将数学公式处理为图片。
1 y- M$ @; u+ u, \; r' m: T4、可生成图文并茂的页面。
; v) t' O) s2 f+ D缺点:
0 N7 @! X0 \# v) w  h1、未处理模板。所有的模板都保留下来了,不够好看,但保持了原有的风味。9 {- @6 E9 D( e# v* {1 U
2、因为是直接处理bz2压缩文件,所以页面中有些链接可能是无效的,就是Wiki网页中红色的链接。
6 n( |! C  r8 Z8 U8 p  P* y3、数学公式是不完美的,有些会出错。, z; T: D: C& f9 B1 y- l
...* U3 \. ?- n' y! M  @" s
- J" c' ]% u) P" a% b3 c; q  a
可是不管怎样,以Simple English Wikipedia为例,WikiCafe处理接近100MB的Dump文件只需要几分钟。如果仅生成文字版中文Wiki的词典,那在1个多小时也能够全部完成,与以往的引擎相比,耗费的时间可谓是天壤之别了。
) [0 S8 a9 C! ^3 s: K3 z  C" g* R# Q: c+ t$ h, ~4 z+ k
组成程序:  z3 i0 \: J, e
WikiCafe.exe 主程序
  f: ^+ ?( G, l! R4 |math.exe     根据Tex公式生成相应图片
8 r0 {8 F0 R! zBin2Img.exe  图片集合文件处理程序. j# {3 q; N+ w; D
Img2Bin.exe  将图片生成集合文件
2 G; ]' I9 m0 a9 T& i1 [可用其他程序如Wiki2Touch处理下载图片后,由Img2Bin汇聚为集合文件。
& l0 ~4 Y( o* P0 G& V  }
% \5 }  {; |% V9 J使用方法:
$ w! L$ g) b6 f! p/ p, e' g1、首先要从dumps.wikimedia.com上下载相应的数据文件。中文以zh开头,可用ctrl+f搜索。
& G9 Y% u# h1 P- {# T  ?$ N6 A1 ?
+ K- j: c( U5 M- x5 E# X2、如果要生成图文版,先用wiki2touch处理,也可下载经过i-wiki处理过的图片集合文件;运行Bin2Img.exe,得到图片索引文件pic.ini。如仅需生成文字版,可直接转下一步。
5 v; f/ l7 ~0 j8 u( w- J
' H2 i# l8 J; H. }: t3、运行WikiCafe.exe,主要有以下参数:, u8 ~* E9 u( d% X! w
.bz2文件    你所下载的Wiki数据文件,无需解压。& y/ R5 y0 \1 t; ?6 _
图片索引文件 如果想要生成图文版词典,你应该提供一个索引文件;如不提供,则不处理图片。
& C% Q; L( W! j/ o' ~6 l. f2 t图片目录    图片等数据存放目录,也就是MdxBuilder中的mdd数据所在位置。公式图片就在此目录下,其他图片必须存放在该目录的pic文件夹中。如不指定或创建失败,则不处理包括公式在内的图片,公式以原Tex形式呈现。
6 G+ \& R& U: |文本文件    生成的目标,即MdxBuilder中的Source文件。. \, c1 i  Y; x0 S7 J2 B
4 R+ Q6 T  L3 C2 H. M" t8 u6 @
WikiCafe运行后将在程序目录中生成:
6 z! k/ D" T* ?, H& U% sWikiCafe.cfg  内容如下例子
3 d& B& n) S$ F, m  xWikiBz2 = r:\simplewiki-20141222-pages-articles.xml.bz2
: k* W$ t, @" t: i* A) q, V% mPicIni = d:\pic.ini/ U+ |" V' A) h' J
ImgDir = r:\data\1 M5 Q# S; u( @8 k8 G
OutTxt = d:\s.txt2 k$ X7 Q* a0 V$ Z
以后再运行WikiCafe,如发现程序目录中有该文件,会询问是否加载。加载可节省人机交互的时间。
6 R7 O' S5 }4 y0 |math.txt    数学公式,供math.exe使用  m9 X' M! c) I3 o( V8 c. }# }( {
images.txt  图片,供Bin2Img.exe使用
  g" J& S* t' k6 u# d: Z7 M7 [7 l
$ k$ Z1 \" C$ M3 b6 t- A) E1 o在图片目录中生成:
: \8 V! l0 }; v) Twiki.css- _, b- t1 O/ {+ x
wiki.png
0 N5 o' @  Y7 M( o. p6 E( Elink.png/ v, z% D' T( [  t+ S& d
5 w" J# Z& _9 B
4、运行math.exe生成数学公式图片,主要参数:
) q% k" `9 S7 v# \4 q* q1 |# Bmath.txt    公式文件,由WikiCafe处理后生成。
! ]5 s% A4 H4 F+ g+ @* [图片目录    可从WikiCafe.cfg中得到。
5 M+ T: g$ J# z  W& X处理过程中会产生错误,无须理会屏幕中的错误信息,如出现异常中断运行,再次运行math.exe会从中断处继续进行处理。
8 H4 `: z& @3 Z6 k4 ^( W  p- z( X2 q5 O2 q# g
5、图文版还需要运行Bin2Img得到词典中的图片,参数有:
; Z4 ?! p. Y) X& d图片集合文件 可下载经过i-wiki处理过的图片集合文件;4 ^  i! s; ~& D* V3 S' b9 K6 x2 H) v
images.txt  图片文件名,由WikiCafe处理后生成。( N# C& V' F% D
图片目录    可从WikiCafe.cfg中得到。6 H7 s: g4 O. o' ?7 k8 C* F1 y

6 x( W( `8 \/ s2 A3 h- G, c6、运行MdxBuilder生成词典% ]0 V' k; ^7 k9 {6 T, s8 b

& r5 A5 j4 L% o

评分

1

查看全部评分

本帖被以下淘专辑推荐:

  • TA的每日心情
    开心
    昨天 18:48
  • 签到天数: 759 天

    [LV.10]以坛为家III

    发表于 2020-4-26 18:30:39 | 显示全部楼层
    本帖最后由 孤影 于 2020-4-26 09:37 编辑 : y( m: j3 U0 ]# ]- Z
    / p- K+ X' g! R/ b! U+ X0 F
    0 u( r; g* Q# y' j4 W
    传个附件,以作备份
    : f- e: e& X2 `3 u. k. P5 l  i6 v
    , {& C# q- Z8 b8 s( n; G2020-4-26& L  y! Q* J  V# f
    win10下不能运行,win7下一切正常
    " E% }* B& x8 o; l/ K& X

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    奋斗
    2018-4-16 08:43
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-4-25 01:11:04 | 显示全部楼层
    都打不开了,有没有新制作wikipedia的工具?

    该用户从未签到

    发表于 2016-8-5 16:10:11 | 显示全部楼层
    加油,支持了

    该用户从未签到

    发表于 2016-8-4 13:57:27 | 显示全部楼层
    大侠,Wiki2Touch等等这些工具有分享吗?

    该用户从未签到

    发表于 2015-5-7 14:53:48 | 显示全部楼层
    个人感觉目前的wiki 制作工具做出来的效果都没有官方Android客户端 Wikipedia Beta[url]http://www.coolapk.com/apk/org.wikipedia.beta[/url] 呈现出的效果好,尤其是制作出的表格在手机端显示不够美观,页面也不像客户端自适应的效果好。
    & D  P! g. i* a9 U% G8 O' D! Z, w4 S. b! k
    我有几点想法:
    " r& x# |; l8 [8 {5 y% i+ D1.用Python或其他工具抓取wiki页面,可以得到有图的源文件;
    4 B/ u* v4 J6 C, R& o2.词典制作时,页面排版可参考“Wikipedia Beta”的处理效果(这一点可以从手机客户端保存的离线页面数据入手)。& ^2 o4 D/ Y- _9 }' |8 C5 A
    ; N. p- }. @( n0 z4 K4 B) h
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    发表于 2015-1-28 11:11:23 | 显示全部楼层
    希望做出一个图文版的

    该用户从未签到

    发表于 2015-1-25 13:06:02 | 显示全部楼层
    速度那是相当的块,不到400m的bz2只用了十几分钟就转完了,排版还算过的去,唯一的遗憾就是模板了。没有处理的模板会有很多冗余的符号{ } 。时隔两年,感谢楼主回归,终于还是用上了,希望能继续完善

    该用户从未签到

    发表于 2015-1-23 18:25:21 | 显示全部楼层
    你们还活跃着... 我已经沉寂1年了.
    ' @' M& z2 o0 ]1 G最近倒是打算把之前留的坑给填了.
    ) l8 U( M& y- A8 O9 y( g可惜我不会c, 帮不了fastwiki了.9 K! v/ I* V% F$ G2 c
    我现在只会bash, lua, python.

    该用户从未签到

     楼主| 发表于 2015-1-11 21:09:29 | 显示全部楼层
    fastwiki 发表于 2015-1-6 11:21- E3 T& w- C# q) M& V
    还在搞 wiki 引擎啊?' I6 k9 J" N# ~
    有兴趣可以来维护 fastwiki , 提供了一堆工具, 可以转换维基百科, 和自制词典,  基本 ...
    8 E4 n& C+ Q) z7 p1 `% Q
    好久没搞了,引擎和以前的相似,只是去掉了模板的处理部分,不再局限于中文Wiki。这个只是想帮助大家提高Wiki词典的生产效率。$ O3 o$ k/ `8 F9 D
    老兄的Fastwiki很好,源码中有没有详细的注释?

    该用户从未签到

     楼主| 发表于 2015-1-11 20:58:37 | 显示全部楼层
    4 o, z, U* x( S3 A
    360往往宁可错杀三千也不放过一个。因为维基咖啡是用PowerBASIC编写的,而很多木马、病毒也是使用这一编程语言来编写,所以很多特征相似。
  • TA的每日心情
    难过
    2018-3-28 11:32
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    发表于 2014-12-31 09:41:13 | 显示全部楼层
    好东西,谢谢分享。

    该用户从未签到

    发表于 2015-1-6 09:14:27 | 显示全部楼层
    这是一个颠覆式的好东西

    该用户从未签到

    发表于 2015-1-6 09:15:31 | 显示全部楼层
    但是有木马

    该用户从未签到

    发表于 2015-1-6 11:21:34 | 显示全部楼层
    还在搞 wiki 引擎啊?
    # p3 E8 `( u% f- o有兴趣可以来维护 fastwiki , 提供了一堆工具, 可以转换维基百科, 和自制词典,  基本由 C++ 写成.' ~/ ?1 Z/ _) E- m: n
    支持全文索引, 图片, 语音, 等等.
    + d: p0 `+ m; k# T9 Q  n
    ) j' l/ M' s2 r7 \3 f4 |, u网页: https://fastwiki.me* s6 z/ u7 @& j% \& C! P
    代码: https://github.com/qianshanhai/fastwiki$ `: z- E8 D4 d0 @

    该用户从未签到

     楼主| 发表于 2015-1-6 19:50:53 | 显示全部楼层
    sexboy2003 发表于 2015-1-6 09:15; T  h( E# l% l3 e  K! @
    但是有木马
    0 _2 U+ H/ w+ i( E9 `$ \( E
    有压缩,但保证没有木马、病毒。

    该用户从未签到

    发表于 2015-1-11 13:20:47 | 显示全部楼层
    我一下载回来就报毒

    该用户从未签到

    发表于 2015-1-11 13:26:10 | 显示全部楼层

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-27 02:57 , Processed in 0.067826 second(s), 13 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表