掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 12052|回复: 35

[工具] WikiBrowser

[复制链接]

该用户从未签到

发表于 2016-6-6 22:30:51 | 显示全部楼层 |阅读模式
本帖最后由 i-wiki 于 2016-6-7 05:53 编辑
( P* l6 l! t# q1 u( x6 l* c2 Q& c* }2 E- W* `+ W5 Z5 u: x
WikiBrowser 不知道放在本版合不合适。
. Y  m3 v( [$ j$ e) |4 r+ v, s8 f, M. Q7 _- ]7 s0 S
维基浏览器 是一个免费的离线维基阅读器,该软件可以让您离线阅读、浏览维基百科。使用时无需联网,所有条目都存储在本地。3 f6 P& v4 l1 U* W

; E% W0 ^2 U  z) k5 L1、文件
8 G# B6 Q# Q0 @( p0 L# e- z 维基浏览器 是绿色软件,只有一个程序文件,无需安装即可使用。当您运行后,会在程序文件夹生成一个wiki.ini文件,其中仅包含两行:, q0 p2 D6 u0 I( l/ [
WikiData = 维基数据文件路径,如c:\wiki\zh.pak/ K" {# F3 G) Y' ~! R4 O1 k
PicBin = 图片集合文件路径,如d:\data\images.bin+ U2 a0 N- T4 r

9 J5 Z6 a8 Q5 \3 l+ m2 P+ o1 `2、下载Wiki数据
4 Y! Y4 k$ ~: m* ?! x( _在使用 维基浏览器 之前,您必须从网上下载维基百科数据。维基媒体定期会备份XML数据(dumps.wikimedia.org),并以bz2格式压缩存储。选择您想要的wiki和备份日期(通常是最近的),寻找并下载文件: *-pages-articles.xml.bz2,它包含了所有文章、模板和元维基。' ?( |$ {  o" o* ^& ?# z2 S# n
+ @) X' ^) r8 ~" r) s
3、转换数据格式- l4 h  T; I! d
下载好的维基数据(.bz2)并不能直接使用,必须处理成 维基浏览器 可以识别的格式(.pak)。一般地,1GB左右大小的.bz2文件可以在10分钟左右处理完成,具体时间与您的CPU速度有关。当然如果有现成的转换后的文件,您也可以复制或下载到您的电脑中。
% x( ?  Z4 ~( v, }. W0 X- {
, `7 k, z, P' q3 z8 x6 ?7 V4、关于图片
! _+ w$ i' ~& z* D有了维基数据文件您就可以使用 维基浏览器 冲浪了。不过如果想看到图文并茂的页面,您还需要下载一个图片集合文件。
# c$ V% `: K# ^# H! R) |
0 g# {! k. O! f  _+ d7 z8 u程序下载
  w+ }5 ?. O: `, }9 R7 t图片集合! p0 l( `% }& }! F# H& [, Q! i3 g; L
该文件也适合于WikiCafe制作图文版百科词典。
- m; i1 N7 A" s# r- a

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

评分

2

查看全部评分

该用户从未签到

发表于 2016-8-8 13:50:07 | 显示全部楼层
i-wiki 发表于 2016-6-12 21:29
2 @6 j2 a- U, I& I' _  Z- {1 ppic.ini并不是真的索引,格式是有些差异的。# ]; L) U8 H. u' ?! J, x) ^4 C% W5 X
WikiCafe的处理是这样的,如果有图片索引,运行后会生成ima ...
如果要生成图文版,先用wiki2touch处理,也可下载经过i-wiki处理过的图片集合文件;运行Bin2Img.exe,得到图片索引文件pic.ini。

. E0 ~0 l4 H( P
8 R' ^4 r# V1 c9 I8 U0 e/ K9 E
( ?% R+ R) N9 G( {) Y3 u7 v: S1 `  _" w8 Q
pic.ini并不是真的索引,格式是有些差异的。
, `5 z* U3 o: Q+ R* QWikiCafe的处理是这样的,如果有图片索引,运行后会生成image.txt,然后Bin2img根据此文件从图片合集中释放相应图片。% }# u" r  c7 ^1 N# z5 O5 I
要得到可用的索引的一个方法就是将pic.ini改名为image.txt,用Bin2img将所有图片释放到磁盘中,然后再用img2bin处理为集合,同时就在图片所在目录得到可用的索引文件。2 a3 O* \) l1 N; u
也可以对pic.ini做一些处理变换...

- ^# ?5 z/ A0 t2 T/ l4 c
4 ]" m* D+ D4 ]- L& }3 t! {这说法感觉很混乱,一般人用这工具几乎没法操作!有点抓狂!!!
- F1 A2 S8 G: p: Y" x' \) w% W  S6 V0 U6 {8 _; O# z6 i
要生成图文版,根据你的描述,我的理解是:" n5 T: E$ q% _# _2 ~4 F8 T
第1步. 运行Bin2Img生成pic.ini,注意:实际运行时并没有释放图片出来!
- \. _$ v9 k7 E7 F0 R6 T( e第2步. 将pic.ini手动改名为image.txt,再运行Bin2Img将所有图片释放出来,得到有效的图片目录ImgDir。
. _0 P' T/ A% b2 l! N第3步. 根据ImgDir,运行Img2Bin生成pic.ini(此pic.ini不同于第1步的pic.ini)。( }/ f' _: h* ^" _8 U! [& ^6 K
第4步. 根据pic.ini和ImgDir,运行WikiCafe,生成图文版的维基文本文件。' M9 A' u" k0 I' G

: `8 W9 {) o2 x% {  [8 _" @" I( K6 p
3 h8 A# B+ `/ v& o8 G多次尝试,运行到第4步,就会提示"图片索引文件格式错误"!!!不知道是不是我理解的有问题???
6 F( Y( |/ Y8 b( v
' s! ^' N( Y, q+ n; l回过头来看这些步骤非常繁琐,实际操作起来非常不方便啊,整个流程需要优化。
6 L/ I& \1 Z. z) D' X% v' n0 h! y3 L: N, t. E! G
, _8 }- U, j' S% t
还有 i-wiki 0.7.6出错就停止运行的问题这么久了,确实属于重大缺陷!然而到目前位置也没有见到有针对此项的改进版本放出来……
+ Q! i' |# d4 r3 f7 L: {

该用户从未签到

 楼主| 发表于 2016-6-12 21:29:01 | 显示全部楼层
邱海波 发表于 2016-6-11 16:46
$ w& z8 N6 T" X* t  \  Y2 ?i-wiki老大你好,我下载你的图片合集images.bin,准备用维基咖啡做图文版时,遇到问题。运行bin2img,得到p ...

  B4 o1 B1 E/ J5 q! Bpic.ini并不是真的索引,格式是有些差异的。3 D" {+ k9 ^! I4 d$ Y
WikiCafe的处理是这样的,如果有图片索引,运行后会生成image.txt,然后Bin2img根据此文件从图片合集中释放相应图片。
4 N) l+ v; z: `" d要得到可用的索引的一个方法就是将pic.ini改名为image.txt,用Bin2img将所有图片释放到磁盘中,然后再用img2bin处理为集合,同时就在图片所在目录得到可用的索引文件。
# V" W6 G0 S+ r也可以对pic.ini做一些处理变换...4 R( i# Y6 P8 F9 ]6 F  m+ J6 J
" J! s4 |+ w" A2 X, ]7 y

该用户从未签到

 楼主| 发表于 2016-6-12 21:17:10 | 显示全部楼层
jacksonsz 发表于 2016-6-8 18:36
* K. `9 A. w2 z赞楼主大牛!
( d; T1 \* I- U8 i* G3 `8 b/ ^( e4 n1 @+ V) K" u; x
~可否再考虑~

6 ^$ X' q& [. x6 Q5 x: C4 I4 v1 窗口是可以拖动的啊!
5 k7 b6 D8 [# w2 可以有。# Z( ~. w7 {) q& \% c7 S/ d
3 我也想,可力有不逮。6 {( J: F2 Q" ^6 L$ v
4 WikiBrowser就是基于webbrowser显示的呀。

该用户从未签到

 楼主| 发表于 2016-6-12 21:10:26 | 显示全部楼层
imfirefly 发表于 2016-6-8 13:53
; Y3 D/ ?. O9 U6 q9 Z( @还是习惯在手机上用BlueDict查看 i-wiki 引擎制作的MDX+MDD格式的词典文件,但是一直以来被一些小问题困扰 ...
/ {6 p0 d- z& W5 g4 h
建议1很好,0.76的引擎有一些Bug,后面的应该好些吧。8 q7 {" M4 S4 p7 e+ Y! b
多进程没问题呀,把xml文件划分为100M左右的部分就是为了多进程处理,在wiki.ini中设置,直接运行多个程序就可以了,一般cpu几个核心就运行几个。耗时长是没有办法的,条目太多,处理量太大。下载时间长,处理时间非常长,生成词典时间很长。正因为时间太长了,才促使我写WikiBrowser。

该用户从未签到

 楼主| 发表于 2016-6-12 20:56:07 | 显示全部楼层
etanalyst 发表于 2016-6-7 21:02$ Y, j. U  O. H9 f! k
这个软件有点类似俄罗斯的DICTAN软件转换,但是更为方便。无论XOWA还是DICTAN都是基于JAVA运行,不知大神的 ...

' R# a* m9 d4 d; ]1 QDictan没用过,有链接吗?WikiBrowser不是基于Java,运行时没有要求JRE吧,所以移植到Android比较难。
  • TA的每日心情

    2018-6-15 14:54
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    发表于 2016-6-11 16:46:59 | 显示全部楼层
    i-wiki老大你好,我下载你的图片合集images.bin,准备用维基咖啡做图文版时,遇到问题。运行bin2img,得到pic.ini,但运行wikicafe时提示索引文件有误。请问该怎么办?7 b1 N& F0 V) ?, h% R
    谢谢!
  • TA的每日心情
    开心
    2025-6-2 12:13
  • 签到天数: 510 天

    [LV.9]以坛为家II

    发表于 2016-6-8 18:36:00 | 显示全部楼层
    赞楼主大牛!1 Q' c* Q. u3 L5 M% l

    - _8 W4 m4 Z& L7 ?1 |* l- ?~可否再考虑~8 U7 N$ A7 z4 |
    1)增加自定义窗口大小(拖拽伸缩),目前仅固定大小或最大化;
    ' v' `- P: N7 w; v$ U7 |& N2)增加支持简-繁显示转换,类似Mdict。  ^$ D1 M8 Z6 a. D" |, A; B: W
    # R& K- u" z: _) J
    3)考虑做个Mac版dmg,类似kiwix多平台。另有IOS/Android版更佳(mdict iOS版显示很棒)。- Q0 k+ A) x7 Q3 S- g
    4)或者考虑做个在浏览器能显示的版本,类似xyzread、Aard2; L+ v3 Y. g( g: Z
    http://bbs.feng.com/read-htm-tid-482728.html
    0 R9 u( I4 J1 f, f' T' N谢谢~期待佳作!
    * j. W. C1 p9 F

    该用户从未签到

    发表于 2016-6-8 13:53:52 | 显示全部楼层
    还是习惯在手机上用BlueDict查看 i-wiki 引擎制作的MDX+MDD格式的词典文件,但是一直以来被一些小问题困扰着,我相信也困扰着像我一样的其他人,那就是:# X6 e, z7 Y: Z8 w% }

    1 G+ _8 o) C* W$ @1. i-wiki 引擎在遇到错误的标签后直接弹出错误提示窗口,然后就退出程序了,需要手工修改错误。如果可以将错误的词条写入另外的文件,然后自动跳过此错误的词条,继续往下处理岂不更好?4 d, u; S: E. y* j
    2. 不支持多进程/多线程同时处理,耗时太长。
      q( c% m; b! c( G) [  t8 ^' m8 P2 n
    5 {7 X6 y5 b, l) u! r" w如果可以将这两个问题解决一下(尤其是第一个问题),就相当好了!希望 i-wiki 可以考虑一下这个问题。  O) k, y- w! g
    先谢过~
  • TA的每日心情

    2018-6-16 00:08
  • 签到天数: 197 天

    [LV.7]常住居民III

    发表于 2016-6-8 13:23:37 | 显示全部楼层
    感谢,终于可以pc上使用这个维基离线了哈。

    该用户从未签到

    发表于 2016-6-7 21:16:14 | 显示全部楼层
    如果能转换英文维基必将功德无量,希望大神在以后的改进中酌加考虑
  • TA的每日心情
    开心
    2025-1-7 17:15
  • 签到天数: 773 天

    [LV.10]以坛为家III

    发表于 2016-6-7 00:03:02 | 显示全部楼层
    + K! N3 l7 b% E% W
    一直在用你的转换引擎呢.期待这次的大作.
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-6-7 00:14:15 来自手机 | 显示全部楼层
    功能大赞!期待楼主的大作!

    该用户从未签到

    发表于 2016-6-7 02:53:26 | 显示全部楼层
    请教如何将BZ2文件转换成.PAK文件,用什么工具,还望指教

    该用户从未签到

     楼主| 发表于 2016-6-7 05:43:56 | 显示全部楼层
    etanalyst 发表于 2016-6-7 02:53' m% m6 {2 z! L- w* R" |
    请教如何将BZ2文件转换成.PAK文件,用什么工具,还望指教

    , `; f$ C4 O# Y! q' Q  \1 `点击“下载”后,在弹出的对话框中3 S; D+ j' Y" W  f1 ?
    7 \' u) k- {* _4 y# M8 G
    第一步: 下载wiki数据(.bz2)8 p  _8 A; A4 w( f! C" ~
    第二步: 处理为可以被WikiBrowser识别的格式(.pak)

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2016-6-7 08:15:41 | 显示全部楼层
    谢谢大神。还想咨询一下,假如我想把转好的.PAK文件在安卓手机上使用,该使用什么安卓文件呢。
  • TA的每日心情
    开心
    2019-6-16 20:48
  • 签到天数: 221 天

    [LV.7]常住居民III

    发表于 2016-6-7 09:13:26 | 显示全部楼层
    感谢楼主提供的方法,我也想知道PAK文件在安卓手机上怎么使用。

    该用户从未签到

    发表于 2016-6-7 09:18:13 | 显示全部楼层
    呵呵,英雄所见略同

    该用户从未签到

    发表于 2016-6-7 10:52:18 | 显示全部楼层
    刚刚将中文维基20160601的数据转成.PAK格式,用时十余分钟,无效链接大约三百左右。使用起来很方便,比开源软件XOWA更优越,原始BZ2文件1.2G,转为.PAK格式1.7G。I-WIKI老大贡献巨大,如果能在安卓手机使用就好了。
  • TA的每日心情
    擦汗
    2019-12-10 14:39
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2016-6-7 13:38:37 | 显示全部楼层
    这都是大神啊

    该用户从未签到

     楼主| 发表于 2016-6-7 15:33:32 | 显示全部楼层
    [email protected] 发表于 2016-6-7 09:13
    ; b5 l5 h* ?) l$ L1 C8 v感谢楼主提供的方法,我也想知道PAK文件在安卓手机上怎么使用。

    1 S: W) ^% O+ y9 r9 o+ {  G  d* D- @' q暂时还没法用...

    该用户从未签到

    发表于 2016-6-7 15:41:54 | 显示全部楼层
    转换英文维基,两次都失败了,12G的英文维基转换到14G左右时程序自动崩溃。不知怎么回事,还请老大指教

    该用户从未签到

    发表于 2016-6-7 17:59:22 | 显示全部楼层
    无法成功制作英文维基,是否文件太大的缘故

    该用户从未签到

    发表于 2016-6-7 20:26:05 | 显示全部楼层
    经过三四次尝试英文维基无法转换,急求解决方案

    该用户从未签到

     楼主| 发表于 2016-6-7 20:41:39 | 显示全部楼层
    除了中文wiki以外没有试过其他(大多数的模板不支持!)。也许文件太大了,词条太多的吧?

    该用户从未签到

    发表于 2016-6-7 21:02:58 | 显示全部楼层
    这个软件有点类似俄罗斯的DICTAN软件转换,但是更为方便。无论XOWA还是DICTAN都是基于JAVA运行,不知大神的这个软件是否同样如此
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-6-16 13:38 , Processed in 0.024730 second(s), 24 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表