掌上百科 - PDAWIKI

标题: WikiBrowser [打印本页]

作者: i-wiki    时间: 2016-6-6 22:30
标题: WikiBrowser
本帖最后由 i-wiki 于 2016-6-7 05:53 编辑
0 G  t" G0 D- i8 i. w1 O
, |9 h8 N& Y! B8 O. @! X$ b1 T$ I; UWikiBrowser 不知道放在本版合不合适。
/ Q. ~* f7 I+ I: N1 H. f; s5 [
2 E8 C) p9 d+ m( _ 维基浏览器 是一个免费的离线维基阅读器,该软件可以让您离线阅读、浏览维基百科。使用时无需联网,所有条目都存储在本地。
9 |; e( ]3 r( y5 a
6 D! p8 ?& Y5 S& f1、文件
; K/ M0 _' h/ a8 g0 w1 O! @ 维基浏览器 是绿色软件,只有一个程序文件,无需安装即可使用。当您运行后,会在程序文件夹生成一个wiki.ini文件,其中仅包含两行:
: S  t0 m  i% [4 V. ]2 dWikiData = 维基数据文件路径,如c:\wiki\zh.pak: B9 F' @2 _* C
PicBin = 图片集合文件路径,如d:\data\images.bin
4 f$ A+ M* q- n+ V/ X) D* ]  l* ~) N$ \3 z% G% W
2、下载Wiki数据
' H& f( p5 c& X: ~) g) y在使用 维基浏览器 之前,您必须从网上下载维基百科数据。维基媒体定期会备份XML数据(dumps.wikimedia.org),并以bz2格式压缩存储。选择您想要的wiki和备份日期(通常是最近的),寻找并下载文件: *-pages-articles.xml.bz2,它包含了所有文章、模板和元维基。
7 a1 O6 d! D% ], |/ _6 x: D% O. [
3、转换数据格式
: |+ p* E& _5 S/ W下载好的维基数据(.bz2)并不能直接使用,必须处理成 维基浏览器 可以识别的格式(.pak)。一般地,1GB左右大小的.bz2文件可以在10分钟左右处理完成,具体时间与您的CPU速度有关。当然如果有现成的转换后的文件,您也可以复制或下载到您的电脑中。
, S; ~# e9 b/ N3 j4 q2 Y) u9 g
" A* L7 g. \4 \9 c: n/ f4、关于图片: I4 L6 a: J2 z! }- w
有了维基数据文件您就可以使用 维基浏览器 冲浪了。不过如果想看到图文并茂的页面,您还需要下载一个图片集合文件。/ s8 c# d  h9 S- Y/ r
5 I$ s" R% B5 Z6 r2 ^. _4 L
程序下载
4 {4 q- O, q. B' a图片集合
+ `/ H; e1 ^& q2 z0 h( S- a该文件也适合于WikiCafe制作图文版百科词典。
* O; S& V! t/ \; Z$ I& ?. m. Q
作者: 孤影    时间: 2016-6-7 00:03
" H( x' m7 K7 O8 ?$ R# j
一直在用你的转换引擎呢.期待这次的大作.
作者: liuyunrushui    时间: 2016-6-7 00:14
功能大赞!期待楼主的大作!
作者: etanalyst    时间: 2016-6-7 02:53
请教如何将BZ2文件转换成.PAK文件,用什么工具,还望指教
作者: i-wiki    时间: 2016-6-7 05:43
etanalyst 发表于 2016-6-7 02:53
% M5 u) i) V) L; n& }: O/ x请教如何将BZ2文件转换成.PAK文件,用什么工具,还望指教
3 r- e* a: _3 T) y
点击“下载”后,在弹出的对话框中
+ l1 y0 \) n/ ]% R. q5 a$ @4 ^$ z- R. b  m; [8 m
第一步: 下载wiki数据(.bz2)
) A) D2 K& V1 d5 I* _1 ^: j; y第二步: 处理为可以被WikiBrowser识别的格式(.pak)
作者: etanalyst    时间: 2016-6-7 08:15
谢谢大神。还想咨询一下,假如我想把转好的.PAK文件在安卓手机上使用,该使用什么安卓文件呢。
作者: [email protected]    时间: 2016-6-7 09:13
感谢楼主提供的方法,我也想知道PAK文件在安卓手机上怎么使用。
作者: etanalyst    时间: 2016-6-7 09:18
呵呵,英雄所见略同
作者: etanalyst    时间: 2016-6-7 10:52
刚刚将中文维基20160601的数据转成.PAK格式,用时十余分钟,无效链接大约三百左右。使用起来很方便,比开源软件XOWA更优越,原始BZ2文件1.2G,转为.PAK格式1.7G。I-WIKI老大贡献巨大,如果能在安卓手机使用就好了。
作者: pyqh0905    时间: 2016-6-7 13:38
这都是大神啊
作者: i-wiki    时间: 2016-6-7 15:33
[email protected] 发表于 2016-6-7 09:13
1 o+ G3 c* k8 p; b7 M0 x. [8 Q! b6 ]2 d感谢楼主提供的方法,我也想知道PAK文件在安卓手机上怎么使用。
4 w* C7 N  D& k. T8 k6 q
暂时还没法用...
作者: etanalyst    时间: 2016-6-7 15:41
转换英文维基,两次都失败了,12G的英文维基转换到14G左右时程序自动崩溃。不知怎么回事,还请老大指教
作者: etanalyst    时间: 2016-6-7 17:59
无法成功制作英文维基,是否文件太大的缘故
作者: etanalyst    时间: 2016-6-7 20:26
经过三四次尝试英文维基无法转换,急求解决方案
作者: i-wiki    时间: 2016-6-7 20:41
除了中文wiki以外没有试过其他(大多数的模板不支持!)。也许文件太大了,词条太多的吧?
作者: etanalyst    时间: 2016-6-7 21:02
这个软件有点类似俄罗斯的DICTAN软件转换,但是更为方便。无论XOWA还是DICTAN都是基于JAVA运行,不知大神的这个软件是否同样如此
作者: etanalyst    时间: 2016-6-7 21:16
如果能转换英文维基必将功德无量,希望大神在以后的改进中酌加考虑
作者: sculiuchang    时间: 2016-6-8 13:23
感谢,终于可以pc上使用这个维基离线了哈。
作者: imfirefly    时间: 2016-6-8 13:53
还是习惯在手机上用BlueDict查看 i-wiki 引擎制作的MDX+MDD格式的词典文件,但是一直以来被一些小问题困扰着,我相信也困扰着像我一样的其他人,那就是:
& r# n# |4 p) l$ b8 \. o. l$ l8 x. b0 }$ O; ^* X& p* U
1. i-wiki 引擎在遇到错误的标签后直接弹出错误提示窗口,然后就退出程序了,需要手工修改错误。如果可以将错误的词条写入另外的文件,然后自动跳过此错误的词条,继续往下处理岂不更好?$ p) p. |4 o, o
2. 不支持多进程/多线程同时处理,耗时太长。  M: k+ \& n; B
7 }5 k9 ^* S8 x" S4 p0 Y# \
如果可以将这两个问题解决一下(尤其是第一个问题),就相当好了!希望 i-wiki 可以考虑一下这个问题。
* }- A6 }. n7 i7 }% }先谢过~
作者: jacksonsz    时间: 2016-6-8 18:36
赞楼主大牛!, @5 j, r- O2 R# ^7 ^  s( [5 ~- k
, i  D5 b$ L+ X- `
~可否再考虑~6 P6 f% x/ r) i
1)增加自定义窗口大小(拖拽伸缩),目前仅固定大小或最大化;. e( p. g. {# Y# ^( v2 o0 ^
2)增加支持简-繁显示转换,类似Mdict。
: b% P6 \' S$ Z5 L2 F+ t& f/ g) p  ^- Y
3)考虑做个Mac版dmg,类似kiwix多平台。另有IOS/Android版更佳(mdict iOS版显示很棒)。
5 V" q0 k* Z) a4)或者考虑做个在浏览器能显示的版本,类似xyzread、Aard2
6 L7 `& r$ L6 f5 Ohttp://bbs.feng.com/read-htm-tid-482728.html% e3 C. y! V% N' b6 b
谢谢~期待佳作!- l4 E  |3 p: n& D5 n7 {

作者: 邱海波    时间: 2016-6-11 16:46
i-wiki老大你好,我下载你的图片合集images.bin,准备用维基咖啡做图文版时,遇到问题。运行bin2img,得到pic.ini,但运行wikicafe时提示索引文件有误。请问该怎么办?
& _/ l/ P! J& t+ n/ Y6 d  v8 z谢谢!
作者: i-wiki    时间: 2016-6-12 20:56
etanalyst 发表于 2016-6-7 21:022 c8 j8 C3 E9 f# i4 X
这个软件有点类似俄罗斯的DICTAN软件转换,但是更为方便。无论XOWA还是DICTAN都是基于JAVA运行,不知大神的 ...
% Y( C* {2 Q- W. g# o- e
Dictan没用过,有链接吗?WikiBrowser不是基于Java,运行时没有要求JRE吧,所以移植到Android比较难。
作者: i-wiki    时间: 2016-6-12 21:10
imfirefly 发表于 2016-6-8 13:539 n$ B& d! O6 c
还是习惯在手机上用BlueDict查看 i-wiki 引擎制作的MDX+MDD格式的词典文件,但是一直以来被一些小问题困扰 ...
! V0 ~: [. B; ^- B
建议1很好,0.76的引擎有一些Bug,后面的应该好些吧。
0 o2 ?$ q, Q. N4 \# d多进程没问题呀,把xml文件划分为100M左右的部分就是为了多进程处理,在wiki.ini中设置,直接运行多个程序就可以了,一般cpu几个核心就运行几个。耗时长是没有办法的,条目太多,处理量太大。下载时间长,处理时间非常长,生成词典时间很长。正因为时间太长了,才促使我写WikiBrowser。
作者: i-wiki    时间: 2016-6-12 21:17
jacksonsz 发表于 2016-6-8 18:36! q3 p9 F' t; z0 z* `# c& |
赞楼主大牛!8 _$ d$ D$ F& \7 `

0 s! r! B6 n. N# q$ @3 t~可否再考虑~
6 n' x( j' Z, T2 c" w* \
1 窗口是可以拖动的啊!
& r; t+ t- [9 @8 I% w- U, h* L2 可以有。
2 N( V8 {" I4 I/ ~4 F, E! S3 我也想,可力有不逮。
. M! h9 a9 k6 H4 WikiBrowser就是基于webbrowser显示的呀。
作者: i-wiki    时间: 2016-6-12 21:29
邱海波 发表于 2016-6-11 16:46) u4 ?# j$ R# O* d: e. `' k
i-wiki老大你好,我下载你的图片合集images.bin,准备用维基咖啡做图文版时,遇到问题。运行bin2img,得到p ...

1 A& ^: t0 J6 u' t" K( N% `pic.ini并不是真的索引,格式是有些差异的。  G2 D# w! x: h- o
WikiCafe的处理是这样的,如果有图片索引,运行后会生成image.txt,然后Bin2img根据此文件从图片合集中释放相应图片。/ ]( o# ~5 x. Z+ S
要得到可用的索引的一个方法就是将pic.ini改名为image.txt,用Bin2img将所有图片释放到磁盘中,然后再用img2bin处理为集合,同时就在图片所在目录得到可用的索引文件。3 Z2 p$ w  C2 k8 v" d9 O
也可以对pic.ini做一些处理变换...
- V7 Y/ v3 J1 D  I+ }) C! q4 n. S  i
0 j$ e) H" C4 m' \0 l4 g
作者: etanalyst    时间: 2016-6-16 17:59
DICTAN http://www.softex.info/downloads/
作者: imfirefly    时间: 2016-8-6 19:24
i-wiki 发表于 2016-6-12 21:10
3 i$ z) `$ k% y2 W% K+ J, Y建议1很好,0.76的引擎有一些Bug,后面的应该好些吧。3 Y- p) @' i& Y' ?9 F+ X( t
多进程没问题呀,把xml文件划分为100M左右的部分 ...
8 @# j  i( F6 a% q
希望你能够尽快放出一个针对0.7.6的一个修改版(当前最主要是能够将我咋建议1”里面提到的问题解决掉即可),谢谢了~
作者: imfirefly    时间: 2016-8-8 13:50
i-wiki 发表于 2016-6-12 21:29" n5 k+ q( O1 P% k
pic.ini并不是真的索引,格式是有些差异的。4 z  h% U8 ~8 A, X8 h
WikiCafe的处理是这样的,如果有图片索引,运行后会生成ima ...
如果要生成图文版,先用wiki2touch处理,也可下载经过i-wiki处理过的图片集合文件;运行Bin2Img.exe,得到图片索引文件pic.ini。
  h5 ]9 x- y& J, g( t

9 n2 a  k- v$ i2 c0 O; y+ S( R# K2 x' t/ {) M8 H
5 Q+ p" ?" J4 @7 }' Z' X/ T6 {
pic.ini并不是真的索引,格式是有些差异的。
" P+ l5 Y, j" R; qWikiCafe的处理是这样的,如果有图片索引,运行后会生成image.txt,然后Bin2img根据此文件从图片合集中释放相应图片。  M! o% C: `: e- P# X
要得到可用的索引的一个方法就是将pic.ini改名为image.txt,用Bin2img将所有图片释放到磁盘中,然后再用img2bin处理为集合,同时就在图片所在目录得到可用的索引文件。4 g) s& R* d( W1 G6 R
也可以对pic.ini做一些处理变换...
" c6 @5 h8 G: [
0 N; Q7 p. \* o
这说法感觉很混乱,一般人用这工具几乎没法操作!有点抓狂!!!8 I$ U- B5 p+ @/ y' t/ `0 [

  ]2 K8 J5 C. `! M* o+ R4 h- s: S. o要生成图文版,根据你的描述,我的理解是:3 F$ Z8 w' S5 f
第1步. 运行Bin2Img生成pic.ini,注意:实际运行时并没有释放图片出来!
- O! X7 S4 V- z1 a第2步. 将pic.ini手动改名为image.txt,再运行Bin2Img将所有图片释放出来,得到有效的图片目录ImgDir。- Y0 b- p5 M- s7 s6 O8 ], y0 @
第3步. 根据ImgDir,运行Img2Bin生成pic.ini(此pic.ini不同于第1步的pic.ini)。6 K: g: Y3 }! R1 L1 z, G2 U
第4步. 根据pic.ini和ImgDir,运行WikiCafe,生成图文版的维基文本文件。$ \! D. y6 @) `, V, c* T

% t5 A4 L/ Q' u% X* G, C
% y& U% S* e, U, U6 Q: B' |多次尝试,运行到第4步,就会提示"图片索引文件格式错误"!!!不知道是不是我理解的有问题???
+ r4 h( K) y3 Q  C- O
& {: R1 b* N# Z& ]7 \, U5 l& S回过头来看这些步骤非常繁琐,实际操作起来非常不方便啊,整个流程需要优化。3 S: [- E2 B# n0 K' v" K

7 ^; q  b  c7 H) h( @% F
2 o* R. `2 m; l7 x" Y- I1 l4 o还有 i-wiki 0.7.6出错就停止运行的问题这么久了,确实属于重大缺陷!然而到目前位置也没有见到有针对此项的改进版本放出来……) U4 R( D/ F6 s

作者: han198808    时间: 2016-8-16 09:19
支持i大,以后上weiji估计都要靠这个了
作者: satangg    时间: 2018-3-7 01:43
7 M$ E: U9 _+ ^" n
这个不错 给个回复加油
作者: china002    时间: 2018-6-17 19:18
请问,我在转换时,为什么总是提示“源文件不存在”呢?
作者: china002    时间: 2018-6-17 23:27
china002 发表于 2018-6-17 19:18. s3 N2 |! t+ `* A7 e- ^: |0 [* \
请问,我在转换时,为什么总是提示“源文件不存在”呢?
# }. q% F) s2 V; G! n; ~; p
已经解决。原来是犯了个低级错误,呵呵
作者: china002    时间: 2018-6-21 19:59
文字版成功!但图片集合也下了,路径也设置了,却总不能图文并茂……
作者: oneopc    时间: 2018-12-28 19:52
刚才下载完成试用了下,图片压缩包解压完有6.94G,打开软件初始化用时8秒,搜索结果显示用时1秒多还是很快的。
作者: godson.cn    时间: 2021-4-3 18:44
谢谢楼主,辛苦你了!
作者: majikun    时间: 2025-4-16 06:10
i-wiki 发表于 2016-6-12 21:29
! l# r# a2 {/ U+ Ipic.ini并不是真的索引,格式是有些差异的。1 ^" f1 _# `' J0 X9 _( U8 D% I
WikiCafe的处理是这样的,如果有图片索引,运行后会生成imag ...
3 T8 ~6 p5 u% d8 ]+ ^2 _' k% f# K
老大,想问下,也可以对pic.ini做一些处理变换,怎么处理变换,




欢迎光临 掌上百科 - PDAWIKI (https://www.pdawiki.com/forum/) Powered by Discuz! X3.4