掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 10202|回复: 34

[工具] WikiBrowser

[复制链接]

该用户从未签到

发表于 2016-6-6 22:30:51 | 显示全部楼层 |阅读模式
本帖最后由 i-wiki 于 2016-6-7 05:53 编辑 7 m' U6 `8 {6 n/ v

6 [* U. h( M. |+ ZWikiBrowser 不知道放在本版合不合适。- F* U+ l2 z# N) d

) C4 i: C# @* f1 i 维基浏览器 是一个免费的离线维基阅读器,该软件可以让您离线阅读、浏览维基百科。使用时无需联网,所有条目都存储在本地。0 d. _9 t$ s4 |# `! s- x  d
3 p+ C  J" n7 Q9 ^1 b& H% c- B
1、文件
5 I( v9 C9 ]/ S) o4 i5 Z0 a: z 维基浏览器 是绿色软件,只有一个程序文件,无需安装即可使用。当您运行后,会在程序文件夹生成一个wiki.ini文件,其中仅包含两行:
/ d$ i6 I9 @' CWikiData = 维基数据文件路径,如c:\wiki\zh.pak
0 h  G4 s* ]% m" P( O! j  D& P/ ^! fPicBin = 图片集合文件路径,如d:\data\images.bin
3 J: f7 L0 k# e+ b) n/ C7 u
* v0 j7 }* \$ J6 N; f( J0 U2、下载Wiki数据
! r  O/ A0 F- n/ ]+ [: o  r( B6 w在使用 维基浏览器 之前,您必须从网上下载维基百科数据。维基媒体定期会备份XML数据(dumps.wikimedia.org),并以bz2格式压缩存储。选择您想要的wiki和备份日期(通常是最近的),寻找并下载文件: *-pages-articles.xml.bz2,它包含了所有文章、模板和元维基。% I( ]: B7 _% K2 ~
' {: l# K; {7 ^  f0 C- ]: x  }
3、转换数据格式8 y, d" z) G2 T- l, W& r
下载好的维基数据(.bz2)并不能直接使用,必须处理成 维基浏览器 可以识别的格式(.pak)。一般地,1GB左右大小的.bz2文件可以在10分钟左右处理完成,具体时间与您的CPU速度有关。当然如果有现成的转换后的文件,您也可以复制或下载到您的电脑中。
) V( {0 P. a+ V/ N4 u) N" d" R9 t4 L: b- O3 Y
4、关于图片$ w) M+ p& I3 `; B, ^
有了维基数据文件您就可以使用 维基浏览器 冲浪了。不过如果想看到图文并茂的页面,您还需要下载一个图片集合文件。1 g/ @% q6 ]' G$ d3 s; z! r* m9 H

- H8 {; s9 ?, N8 P8 f  `, ]5 X' e程序下载! ]" i( \" [$ H6 `  m$ Z
图片集合5 B) X( c8 X& k6 @( ?3 h8 E) m
该文件也适合于WikiCafe制作图文版百科词典。
7 k' @' A! X- @

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

评分

2

查看全部评分

该用户从未签到

发表于 2016-8-8 13:50:07 | 显示全部楼层
i-wiki 发表于 2016-6-12 21:29) V2 ]( v* p, x! |7 k
pic.ini并不是真的索引,格式是有些差异的。
% B5 l# }5 P" d$ s' _WikiCafe的处理是这样的,如果有图片索引,运行后会生成ima ...
如果要生成图文版,先用wiki2touch处理,也可下载经过i-wiki处理过的图片集合文件;运行Bin2Img.exe,得到图片索引文件pic.ini。

7 g) t+ \/ t- y4 L7 s2 B. x
+ E& K$ M& R1 i( ?$ j5 J9 i4 e( |
2 z* n  S1 X  r7 S& @; I  L" |
pic.ini并不是真的索引,格式是有些差异的。
" J% i+ v; E8 @2 xWikiCafe的处理是这样的,如果有图片索引,运行后会生成image.txt,然后Bin2img根据此文件从图片合集中释放相应图片。" H( g" N9 E3 s* Q
要得到可用的索引的一个方法就是将pic.ini改名为image.txt,用Bin2img将所有图片释放到磁盘中,然后再用img2bin处理为集合,同时就在图片所在目录得到可用的索引文件。3 c7 f4 m5 S/ D- ~% o. ]
也可以对pic.ini做一些处理变换...
. O, @0 O# n- e% G6 f

3 C$ E. @  p% ^: k9 l7 T这说法感觉很混乱,一般人用这工具几乎没法操作!有点抓狂!!!
. I  s% y% y5 E2 h" N3 b6 b. U4 j( z: L+ B- o6 Z  T
要生成图文版,根据你的描述,我的理解是:
8 C. T- ^/ v( H' i第1步. 运行Bin2Img生成pic.ini,注意:实际运行时并没有释放图片出来!$ p, l. a9 P, Q$ o( ]( F: M/ c6 N
第2步. 将pic.ini手动改名为image.txt,再运行Bin2Img将所有图片释放出来,得到有效的图片目录ImgDir。
( m8 @. S. D/ X7 V8 D0 Q第3步. 根据ImgDir,运行Img2Bin生成pic.ini(此pic.ini不同于第1步的pic.ini)。: X$ @, @: c' ]$ {$ p5 Z; t4 w- }
第4步. 根据pic.ini和ImgDir,运行WikiCafe,生成图文版的维基文本文件。
8 ]8 J7 f' U- ]
" n4 Q& V3 T; z7 A6 A
1 a8 X* O6 U! b0 `1 U$ _多次尝试,运行到第4步,就会提示"图片索引文件格式错误"!!!不知道是不是我理解的有问题???
8 E8 u/ E: c; W+ I: V0 ^- I, E  c7 n8 L1 g
回过头来看这些步骤非常繁琐,实际操作起来非常不方便啊,整个流程需要优化。
7 q( w- O2 `' \  \$ z; k5 Z/ D$ z9 [

) u! G" d0 h9 e, ]- Z还有 i-wiki 0.7.6出错就停止运行的问题这么久了,确实属于重大缺陷!然而到目前位置也没有见到有针对此项的改进版本放出来……/ v* b8 Z' T3 C3 B; K- ^% r! s

该用户从未签到

 楼主| 发表于 2016-6-12 21:29:01 | 显示全部楼层
邱海波 发表于 2016-6-11 16:46, S3 ]  t/ a$ V2 P2 O
i-wiki老大你好,我下载你的图片合集images.bin,准备用维基咖啡做图文版时,遇到问题。运行bin2img,得到p ...
6 f* T) {: B8 l
pic.ini并不是真的索引,格式是有些差异的。' w2 b) L& @% [) s
WikiCafe的处理是这样的,如果有图片索引,运行后会生成image.txt,然后Bin2img根据此文件从图片合集中释放相应图片。" z1 W0 ~2 F, V, b9 K
要得到可用的索引的一个方法就是将pic.ini改名为image.txt,用Bin2img将所有图片释放到磁盘中,然后再用img2bin处理为集合,同时就在图片所在目录得到可用的索引文件。& H; X( S& Q* |/ w- V: J- |+ b; v
也可以对pic.ini做一些处理变换...
8 C$ v1 u( }% s, g2 y
* ~4 o0 A+ S: L& h% }+ v2 G$ L

该用户从未签到

 楼主| 发表于 2016-6-12 21:17:10 | 显示全部楼层
jacksonsz 发表于 2016-6-8 18:36
) Z6 Q2 n% Y, S5 v8 p2 f4 m赞楼主大牛!& `& m4 \/ _+ a+ j5 Z! k) ~
, H  U% q  c0 R6 R: [
~可否再考虑~

9 B* X. L) Q) j( U1 ~4 a1 窗口是可以拖动的啊!
4 L: }. F: W' P) C; q: s, Z2 可以有。
0 n# `1 s1 G9 C2 f' z, m* Z3 我也想,可力有不逮。' v+ M/ Q& Q( l5 e( i9 {
4 WikiBrowser就是基于webbrowser显示的呀。

该用户从未签到

 楼主| 发表于 2016-6-12 21:10:26 | 显示全部楼层
imfirefly 发表于 2016-6-8 13:535 T8 ~5 {! s. ^& Y, u
还是习惯在手机上用BlueDict查看 i-wiki 引擎制作的MDX+MDD格式的词典文件,但是一直以来被一些小问题困扰 ...

# R$ X! L5 p2 z$ S: k" i建议1很好,0.76的引擎有一些Bug,后面的应该好些吧。5 j' V# m0 w: I* |9 N, B
多进程没问题呀,把xml文件划分为100M左右的部分就是为了多进程处理,在wiki.ini中设置,直接运行多个程序就可以了,一般cpu几个核心就运行几个。耗时长是没有办法的,条目太多,处理量太大。下载时间长,处理时间非常长,生成词典时间很长。正因为时间太长了,才促使我写WikiBrowser。

该用户从未签到

 楼主| 发表于 2016-6-12 20:56:07 | 显示全部楼层
etanalyst 发表于 2016-6-7 21:02. b( j) }7 G( t4 U5 K
这个软件有点类似俄罗斯的DICTAN软件转换,但是更为方便。无论XOWA还是DICTAN都是基于JAVA运行,不知大神的 ...

; x4 B2 A$ c- O) U4 `, b/ [Dictan没用过,有链接吗?WikiBrowser不是基于Java,运行时没有要求JRE吧,所以移植到Android比较难。
  • TA的每日心情

    2018-6-15 14:54
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    发表于 2016-6-11 16:46:59 | 显示全部楼层
    i-wiki老大你好,我下载你的图片合集images.bin,准备用维基咖啡做图文版时,遇到问题。运行bin2img,得到pic.ini,但运行wikicafe时提示索引文件有误。请问该怎么办?
    ' i) Y! h% @; N' @5 m  X谢谢!
  • TA的每日心情
    开心
    2024-3-25 16:51
  • 签到天数: 503 天

    [LV.9]以坛为家II

    发表于 2016-6-8 18:36:00 | 显示全部楼层
    赞楼主大牛!8 |2 Q0 w: s" [6 m, k* D
    - U* v& Z$ ?3 Q! h) i
    ~可否再考虑~
    5 s  K6 q6 G5 Z. U5 S1)增加自定义窗口大小(拖拽伸缩),目前仅固定大小或最大化;
    ) q+ v1 O% n5 ~8 R/ T% F5 x2)增加支持简-繁显示转换,类似Mdict。) E. \" H' Z* @" v! ]( r6 |

    : Z! D' S  Y1 K1 r3)考虑做个Mac版dmg,类似kiwix多平台。另有IOS/Android版更佳(mdict iOS版显示很棒)。
    ) t# M$ N7 ^" g0 j! u, Z8 D6 I2 F4)或者考虑做个在浏览器能显示的版本,类似xyzread、Aard2: b1 S4 t  t  O
    http://bbs.feng.com/read-htm-tid-482728.html9 x1 o; j8 r# p' {; C% p# h7 t
    谢谢~期待佳作!5 z1 V4 s! @6 Q

    该用户从未签到

    发表于 2016-6-8 13:53:52 | 显示全部楼层
    还是习惯在手机上用BlueDict查看 i-wiki 引擎制作的MDX+MDD格式的词典文件,但是一直以来被一些小问题困扰着,我相信也困扰着像我一样的其他人,那就是:8 k/ a+ u: F) n$ g; M9 g/ V

    2 ~6 h6 x5 T( A. o7 {$ I& Z1. i-wiki 引擎在遇到错误的标签后直接弹出错误提示窗口,然后就退出程序了,需要手工修改错误。如果可以将错误的词条写入另外的文件,然后自动跳过此错误的词条,继续往下处理岂不更好?
    + ?6 X, N; t( b! F2 M' @2. 不支持多进程/多线程同时处理,耗时太长。4 q2 |1 d6 P0 ]0 Y, }

      W/ H, ~0 V* \: i如果可以将这两个问题解决一下(尤其是第一个问题),就相当好了!希望 i-wiki 可以考虑一下这个问题。6 l( l5 j$ s2 s' P! s
    先谢过~
  • TA的每日心情

    2018-6-16 00:08
  • 签到天数: 197 天

    [LV.7]常住居民III

    发表于 2016-6-8 13:23:37 | 显示全部楼层
    感谢,终于可以pc上使用这个维基离线了哈。

    该用户从未签到

    发表于 2016-6-7 21:16:14 | 显示全部楼层
    如果能转换英文维基必将功德无量,希望大神在以后的改进中酌加考虑
  • TA的每日心情
    开心
    7 天前
  • 签到天数: 759 天

    [LV.10]以坛为家III

    发表于 2016-6-7 00:03:02 | 显示全部楼层

    + Q6 z7 p# ~( i! v8 u一直在用你的转换引擎呢.期待这次的大作.
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-6-7 00:14:15 来自手机 | 显示全部楼层
    功能大赞!期待楼主的大作!

    该用户从未签到

    发表于 2016-6-7 02:53:26 | 显示全部楼层
    请教如何将BZ2文件转换成.PAK文件,用什么工具,还望指教

    该用户从未签到

     楼主| 发表于 2016-6-7 05:43:56 | 显示全部楼层
    etanalyst 发表于 2016-6-7 02:53
    9 `, \0 T! V* v; \; N; e请教如何将BZ2文件转换成.PAK文件,用什么工具,还望指教
    / [0 P% R4 k0 O) O9 [5 k- {
    点击“下载”后,在弹出的对话框中
    7 W% ]# J: D0 v. H* A, I+ _
    ( Q9 K: [' r" v/ [6 N' M' D) J第一步: 下载wiki数据(.bz2)$ G' Q: X8 q, q
    第二步: 处理为可以被WikiBrowser识别的格式(.pak)

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2016-6-7 08:15:41 | 显示全部楼层
    谢谢大神。还想咨询一下,假如我想把转好的.PAK文件在安卓手机上使用,该使用什么安卓文件呢。
  • TA的每日心情
    开心
    2019-6-16 20:48
  • 签到天数: 221 天

    [LV.7]常住居民III

    发表于 2016-6-7 09:13:26 | 显示全部楼层
    感谢楼主提供的方法,我也想知道PAK文件在安卓手机上怎么使用。

    该用户从未签到

    发表于 2016-6-7 09:18:13 | 显示全部楼层
    呵呵,英雄所见略同

    该用户从未签到

    发表于 2016-6-7 10:52:18 | 显示全部楼层
    刚刚将中文维基20160601的数据转成.PAK格式,用时十余分钟,无效链接大约三百左右。使用起来很方便,比开源软件XOWA更优越,原始BZ2文件1.2G,转为.PAK格式1.7G。I-WIKI老大贡献巨大,如果能在安卓手机使用就好了。
  • TA的每日心情
    擦汗
    2019-12-10 14:39
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2016-6-7 13:38:37 | 显示全部楼层
    这都是大神啊

    该用户从未签到

     楼主| 发表于 2016-6-7 15:33:32 | 显示全部楼层
    [email protected] 发表于 2016-6-7 09:13
    8 i: P# t( ?% g$ n6 J5 K感谢楼主提供的方法,我也想知道PAK文件在安卓手机上怎么使用。

    . c1 i% _7 x! Y" s暂时还没法用...

    该用户从未签到

    发表于 2016-6-7 15:41:54 | 显示全部楼层
    转换英文维基,两次都失败了,12G的英文维基转换到14G左右时程序自动崩溃。不知怎么回事,还请老大指教

    该用户从未签到

    发表于 2016-6-7 17:59:22 | 显示全部楼层
    无法成功制作英文维基,是否文件太大的缘故

    该用户从未签到

    发表于 2016-6-7 20:26:05 | 显示全部楼层
    经过三四次尝试英文维基无法转换,急求解决方案

    该用户从未签到

     楼主| 发表于 2016-6-7 20:41:39 | 显示全部楼层
    除了中文wiki以外没有试过其他(大多数的模板不支持!)。也许文件太大了,词条太多的吧?

    该用户从未签到

    发表于 2016-6-7 21:02:58 | 显示全部楼层
    这个软件有点类似俄罗斯的DICTAN软件转换,但是更为方便。无论XOWA还是DICTAN都是基于JAVA运行,不知大神的这个软件是否同样如此
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-3 18:08 , Processed in 0.054340 second(s), 10 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表