掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 11529|回复: 35

[工具] WikiBrowser

[复制链接]

该用户从未签到

发表于 2016-6-6 22:30:51 | 显示全部楼层 |阅读模式
本帖最后由 i-wiki 于 2016-6-7 05:53 编辑 7 F1 N) a  V% P6 D! I+ }

1 a0 t1 e$ P, |7 b4 U# Z" y0 Z& tWikiBrowser 不知道放在本版合不合适。
, m* r1 Y8 z9 d3 c* {' ^1 e9 T) k, U3 G3 U: B8 w, S1 [
维基浏览器 是一个免费的离线维基阅读器,该软件可以让您离线阅读、浏览维基百科。使用时无需联网,所有条目都存储在本地。
3 [) Y0 P/ [3 b6 z; `' l
. @" C  n3 y1 i1、文件
$ I4 o# M$ Y% @& w7 A1 g 维基浏览器 是绿色软件,只有一个程序文件,无需安装即可使用。当您运行后,会在程序文件夹生成一个wiki.ini文件,其中仅包含两行:
4 Q3 R$ S9 H# z+ FWikiData = 维基数据文件路径,如c:\wiki\zh.pak3 q; ~" S, B' t
PicBin = 图片集合文件路径,如d:\data\images.bin
  C0 c' q0 C  i2 u7 `% B% _0 j% c
  F: Z+ U, j( j$ J& |2、下载Wiki数据# l- |7 n  t4 R6 M
在使用 维基浏览器 之前,您必须从网上下载维基百科数据。维基媒体定期会备份XML数据(dumps.wikimedia.org),并以bz2格式压缩存储。选择您想要的wiki和备份日期(通常是最近的),寻找并下载文件: *-pages-articles.xml.bz2,它包含了所有文章、模板和元维基。- x2 E: f/ d. n' O% t+ C

% V* P, B  n) p( B$ P3、转换数据格式* m; r* W; Y; R
下载好的维基数据(.bz2)并不能直接使用,必须处理成 维基浏览器 可以识别的格式(.pak)。一般地,1GB左右大小的.bz2文件可以在10分钟左右处理完成,具体时间与您的CPU速度有关。当然如果有现成的转换后的文件,您也可以复制或下载到您的电脑中。9 x' `& L0 B3 h& _: N* z* p
. T' `/ t5 G' A& f+ o% z7 z5 R
4、关于图片* Q% u0 q, E" Z  f: f. N
有了维基数据文件您就可以使用 维基浏览器 冲浪了。不过如果想看到图文并茂的页面,您还需要下载一个图片集合文件。+ M1 {4 U6 p! t* x
5 p* s; c+ G# L' j1 a1 m  n1 D" b0 a
程序下载
) y' o& j4 q# K$ l3 ^图片集合
& O2 t0 j& ~4 {7 A该文件也适合于WikiCafe制作图文版百科词典。
# _/ @5 B6 n- c* F6 ^' }

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

评分

2

查看全部评分

该用户从未签到

发表于 2016-8-8 13:50:07 | 显示全部楼层
i-wiki 发表于 2016-6-12 21:29
' ]4 E  K1 i2 v/ X6 ~( I' Q, z3 |pic.ini并不是真的索引,格式是有些差异的。
9 B7 n9 Z' R9 f2 q1 S" i! }WikiCafe的处理是这样的,如果有图片索引,运行后会生成ima ...
如果要生成图文版,先用wiki2touch处理,也可下载经过i-wiki处理过的图片集合文件;运行Bin2Img.exe,得到图片索引文件pic.ini。

# T3 z8 f6 f& l5 {- O/ ]& r) g- R" Y$ G) o4 J+ D

5 z: a* ]& t" T" z+ l4 x) x6 c: Y/ l0 {2 V; ]
pic.ini并不是真的索引,格式是有些差异的。, M! R* b9 ?" x8 \3 ?
WikiCafe的处理是这样的,如果有图片索引,运行后会生成image.txt,然后Bin2img根据此文件从图片合集中释放相应图片。! F4 H" `* h: X' V5 a+ {" B+ b
要得到可用的索引的一个方法就是将pic.ini改名为image.txt,用Bin2img将所有图片释放到磁盘中,然后再用img2bin处理为集合,同时就在图片所在目录得到可用的索引文件。0 B) E  b! V1 i9 ~5 ]8 a2 T
也可以对pic.ini做一些处理变换...
  p, _' V9 v& s" r" C7 y/ z- m
0 A2 J, N: o/ w6 P0 u  F
这说法感觉很混乱,一般人用这工具几乎没法操作!有点抓狂!!!' R1 [  ?6 f/ ~: Y1 V0 w0 _

3 x. C9 E# C  e" D4 e0 d要生成图文版,根据你的描述,我的理解是:
/ f) Y* c0 Q0 q- ?3 @1 R% q第1步. 运行Bin2Img生成pic.ini,注意:实际运行时并没有释放图片出来!
; D% a/ S. w6 G/ A/ V; }第2步. 将pic.ini手动改名为image.txt,再运行Bin2Img将所有图片释放出来,得到有效的图片目录ImgDir。/ \  F+ v% V, l% S8 u6 M; I& N
第3步. 根据ImgDir,运行Img2Bin生成pic.ini(此pic.ini不同于第1步的pic.ini)。( N3 J) l  ]! t' B
第4步. 根据pic.ini和ImgDir,运行WikiCafe,生成图文版的维基文本文件。
& g: `0 M" \  Y+ {3 g/ K2 P1 N* y) T( l

5 O" z% g2 `) S' Z# h多次尝试,运行到第4步,就会提示"图片索引文件格式错误"!!!不知道是不是我理解的有问题???
  ~5 d- o1 ^8 s( y9 @5 L
3 d- m0 c, ^" K  I! j回过头来看这些步骤非常繁琐,实际操作起来非常不方便啊,整个流程需要优化。5 D" {8 P( H' E. S4 T
9 q  x% s4 B4 x7 x  t4 q0 [; N

1 Z3 g6 s" T/ X3 ]还有 i-wiki 0.7.6出错就停止运行的问题这么久了,确实属于重大缺陷!然而到目前位置也没有见到有针对此项的改进版本放出来……
3 j; H" d: l! i* L: L

该用户从未签到

 楼主| 发表于 2016-6-12 21:29:01 | 显示全部楼层
邱海波 发表于 2016-6-11 16:46
* S( o3 N5 o+ M9 Li-wiki老大你好,我下载你的图片合集images.bin,准备用维基咖啡做图文版时,遇到问题。运行bin2img,得到p ...
1 m9 |5 y5 ?" Y1 c8 P( R6 d. [
pic.ini并不是真的索引,格式是有些差异的。0 |# _5 w# _  ?" }6 Q( l) \# O
WikiCafe的处理是这样的,如果有图片索引,运行后会生成image.txt,然后Bin2img根据此文件从图片合集中释放相应图片。6 m2 l& Y$ {  j
要得到可用的索引的一个方法就是将pic.ini改名为image.txt,用Bin2img将所有图片释放到磁盘中,然后再用img2bin处理为集合,同时就在图片所在目录得到可用的索引文件。
: m7 v, p( E% `. F也可以对pic.ini做一些处理变换...
: N) C) i7 m2 j" _/ C; q
$ {( c; s+ S; O( K

该用户从未签到

 楼主| 发表于 2016-6-12 21:17:10 | 显示全部楼层
jacksonsz 发表于 2016-6-8 18:36
# r2 T/ U2 }( n. o+ {$ t赞楼主大牛!) V% j! N. D: z* ]

- {0 q; w3 V) S' F9 M~可否再考虑~
2 x  f9 y, G" E& {; \5 s
1 窗口是可以拖动的啊!- d( e" a& z$ S; d6 V6 D
2 可以有。
" X, s( q9 Z4 j) l& @& J$ k3 我也想,可力有不逮。3 \5 G0 z( f( W0 U
4 WikiBrowser就是基于webbrowser显示的呀。

该用户从未签到

 楼主| 发表于 2016-6-12 21:10:26 | 显示全部楼层
imfirefly 发表于 2016-6-8 13:53
. G( C# b3 @/ Z+ a还是习惯在手机上用BlueDict查看 i-wiki 引擎制作的MDX+MDD格式的词典文件,但是一直以来被一些小问题困扰 ...

2 v. @; P& j, x建议1很好,0.76的引擎有一些Bug,后面的应该好些吧。
3 L! x$ m' g  V4 a1 j多进程没问题呀,把xml文件划分为100M左右的部分就是为了多进程处理,在wiki.ini中设置,直接运行多个程序就可以了,一般cpu几个核心就运行几个。耗时长是没有办法的,条目太多,处理量太大。下载时间长,处理时间非常长,生成词典时间很长。正因为时间太长了,才促使我写WikiBrowser。

该用户从未签到

 楼主| 发表于 2016-6-12 20:56:07 | 显示全部楼层
etanalyst 发表于 2016-6-7 21:028 V  a1 o. \% w) V& f  M; {& e
这个软件有点类似俄罗斯的DICTAN软件转换,但是更为方便。无论XOWA还是DICTAN都是基于JAVA运行,不知大神的 ...

2 L3 I8 @- q; o: UDictan没用过,有链接吗?WikiBrowser不是基于Java,运行时没有要求JRE吧,所以移植到Android比较难。
  • TA的每日心情

    2018-6-15 14:54
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    发表于 2016-6-11 16:46:59 | 显示全部楼层
    i-wiki老大你好,我下载你的图片合集images.bin,准备用维基咖啡做图文版时,遇到问题。运行bin2img,得到pic.ini,但运行wikicafe时提示索引文件有误。请问该怎么办?
    ; _' B! g! N" V& i9 X6 y0 t: O7 d: |谢谢!
  • TA的每日心情
    开心
    2025-5-5 02:21
  • 签到天数: 508 天

    [LV.9]以坛为家II

    发表于 2016-6-8 18:36:00 | 显示全部楼层
    赞楼主大牛!
    7 f' p# T# F9 {5 C, C
    ! K' _( x& B; ^1 N~可否再考虑~( d' J$ n/ p  |
    1)增加自定义窗口大小(拖拽伸缩),目前仅固定大小或最大化;5 {  G; ]% h! y7 G0 v1 @9 C9 T
    2)增加支持简-繁显示转换,类似Mdict。3 E3 C, J0 t/ t6 t* A1 a8 B
    7 k# w" Q! {% ~: J* E+ Z
    3)考虑做个Mac版dmg,类似kiwix多平台。另有IOS/Android版更佳(mdict iOS版显示很棒)。
    / r- p" W1 h0 p9 B3 {, |+ |4)或者考虑做个在浏览器能显示的版本,类似xyzread、Aard23 e, N1 x4 O7 H- q
    http://bbs.feng.com/read-htm-tid-482728.html) I% F, s4 ?: R
    谢谢~期待佳作!
    9 h+ C, k' x( b+ z; R

    该用户从未签到

    发表于 2016-6-8 13:53:52 | 显示全部楼层
    还是习惯在手机上用BlueDict查看 i-wiki 引擎制作的MDX+MDD格式的词典文件,但是一直以来被一些小问题困扰着,我相信也困扰着像我一样的其他人,那就是:1 m3 s! d6 D' e9 j" Q( ~
    8 O* d, `' d( |; p5 E+ Q8 I9 o
    1. i-wiki 引擎在遇到错误的标签后直接弹出错误提示窗口,然后就退出程序了,需要手工修改错误。如果可以将错误的词条写入另外的文件,然后自动跳过此错误的词条,继续往下处理岂不更好?
    % }+ v- K2 Q& W! ^/ {) a6 `2. 不支持多进程/多线程同时处理,耗时太长。' u- `5 ?. n0 m- p' N7 x' s, X

    ( x/ _8 {2 H# \6 ?1 T0 e# e如果可以将这两个问题解决一下(尤其是第一个问题),就相当好了!希望 i-wiki 可以考虑一下这个问题。
    # N* s; ]3 C( y1 E: H$ A, k先谢过~
  • TA的每日心情

    2018-6-16 00:08
  • 签到天数: 197 天

    [LV.7]常住居民III

    发表于 2016-6-8 13:23:37 | 显示全部楼层
    感谢,终于可以pc上使用这个维基离线了哈。

    该用户从未签到

    发表于 2016-6-7 21:16:14 | 显示全部楼层
    如果能转换英文维基必将功德无量,希望大神在以后的改进中酌加考虑
  • TA的每日心情
    开心
    2025-1-7 17:15
  • 签到天数: 773 天

    [LV.10]以坛为家III

    发表于 2016-6-7 00:03:02 | 显示全部楼层
    ; e/ v5 K; e+ }1 R0 d& i! p- p
    一直在用你的转换引擎呢.期待这次的大作.
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-6-7 00:14:15 来自手机 | 显示全部楼层
    功能大赞!期待楼主的大作!

    该用户从未签到

    发表于 2016-6-7 02:53:26 | 显示全部楼层
    请教如何将BZ2文件转换成.PAK文件,用什么工具,还望指教

    该用户从未签到

     楼主| 发表于 2016-6-7 05:43:56 | 显示全部楼层
    etanalyst 发表于 2016-6-7 02:53
    ) b  q$ s3 a2 H. g请教如何将BZ2文件转换成.PAK文件,用什么工具,还望指教
    ( z2 B2 m; [2 t6 c& B! t
    点击“下载”后,在弹出的对话框中  n( w2 h9 s& |+ |  d/ t
    ( [$ y$ w2 w8 o6 {  S. z5 p0 d/ G
    第一步: 下载wiki数据(.bz2)
    2 M+ a1 u3 D+ j! f1 V& J: x第二步: 处理为可以被WikiBrowser识别的格式(.pak)

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2016-6-7 08:15:41 | 显示全部楼层
    谢谢大神。还想咨询一下,假如我想把转好的.PAK文件在安卓手机上使用,该使用什么安卓文件呢。
  • TA的每日心情
    开心
    2019-6-16 20:48
  • 签到天数: 221 天

    [LV.7]常住居民III

    发表于 2016-6-7 09:13:26 | 显示全部楼层
    感谢楼主提供的方法,我也想知道PAK文件在安卓手机上怎么使用。

    该用户从未签到

    发表于 2016-6-7 09:18:13 | 显示全部楼层
    呵呵,英雄所见略同

    该用户从未签到

    发表于 2016-6-7 10:52:18 | 显示全部楼层
    刚刚将中文维基20160601的数据转成.PAK格式,用时十余分钟,无效链接大约三百左右。使用起来很方便,比开源软件XOWA更优越,原始BZ2文件1.2G,转为.PAK格式1.7G。I-WIKI老大贡献巨大,如果能在安卓手机使用就好了。
  • TA的每日心情
    擦汗
    2019-12-10 14:39
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2016-6-7 13:38:37 | 显示全部楼层
    这都是大神啊

    该用户从未签到

     楼主| 发表于 2016-6-7 15:33:32 | 显示全部楼层
    [email protected] 发表于 2016-6-7 09:13
    - F9 C- Y  W2 y9 s6 B% M感谢楼主提供的方法,我也想知道PAK文件在安卓手机上怎么使用。
    4 b# r, W3 `1 c% [! {6 C& L7 ~
    暂时还没法用...

    该用户从未签到

    发表于 2016-6-7 15:41:54 | 显示全部楼层
    转换英文维基,两次都失败了,12G的英文维基转换到14G左右时程序自动崩溃。不知怎么回事,还请老大指教

    该用户从未签到

    发表于 2016-6-7 17:59:22 | 显示全部楼层
    无法成功制作英文维基,是否文件太大的缘故

    该用户从未签到

    发表于 2016-6-7 20:26:05 | 显示全部楼层
    经过三四次尝试英文维基无法转换,急求解决方案

    该用户从未签到

     楼主| 发表于 2016-6-7 20:41:39 | 显示全部楼层
    除了中文wiki以外没有试过其他(大多数的模板不支持!)。也许文件太大了,词条太多的吧?

    该用户从未签到

    发表于 2016-6-7 21:02:58 | 显示全部楼层
    这个软件有点类似俄罗斯的DICTAN软件转换,但是更为方便。无论XOWA还是DICTAN都是基于JAVA运行,不知大神的这个软件是否同样如此
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-18 08:31 , Processed in 0.024153 second(s), 24 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表