掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 2436|回复: 14

[新版发布] fastwiki-2.2.2.exe 处理enwiktionary.xml.bz2 时,程序出错,中止退出。

[复制链接]

该用户从未签到

发表于 2013-2-25 19:52:59 | 显示全部楼层 |阅读模式
本帖最后由 bltian 于 2013-2-26 11:38 编辑 # H8 E* F* l6 c, |& |: e

1 }+ M; q' M- W. e  [fastwiki-2.2.2.exe 处理enwiktionary.xml.bz2 时,程序出错,中止退出。
' A( B# c, ~. U* W+ m
- l5 g7 Y5 X) m5 \5 l2 o0 r/ m/ b+ k以下三个都有这个问题:
! B7 E4 s0 ]5 R  ^' t9 e/ Ezhwikisource/20130215/zhwikisource-20130215-pages-articles.xml.bz27 A8 U. P6 y4 D8 R8 I
zhwiktionary/20130220/zhwiktionary-20130220-pages-articles.xml.bz28 H- _& N1 r  b
enwiktionary/20130213/enwiktionary-20130213-pages-articles.xml.bz2

该用户从未签到

发表于 2013-2-26 21:08:15 | 显示全部楼层
能描述一下详细情况吗?
$ f2 w9 C, f3 \$ X6 H; _- b8 C1。转到哪里的时候出错?
& q6 e6 w) q, V7 I" ?2。能截个图上来吗?
! J4 J" U2 x6 f5 n9 n
& I, b1 m1 d" I' {1 R9 Q多谢。
; Q  o: _0 a* o3 \6 [( i1 H
) t) v4 x; b8 m! G: qps. 我转换 zhwikisource 和 zhwiktionary 都没问题啊

该用户从未签到

 楼主| 发表于 2013-2-26 23:42:22 | 显示全部楼层
这里截图贴不上来,已经发到你的邮箱:[email protected]

该用户从未签到

发表于 2013-2-27 17:24:28 | 显示全部楼层
fastwiki-2.2.2.exe 处理enwiktionary.xml.bz2 时,程序出错,中止退出。
7 q- v7 t7 U% Q6 M7 p6 f8 r3 |" I5 U/ a# a1 e+ j0 Z; u0 S4 Z
以下三个都有这个问题:6 Q' S8 J% b& l
zhwikisource/20130215/zhwikisource-20130215-pages-articles.xml.bz2
4 D, q: z+ ~: [zhwiktionary/20130220/zhwiktionary-2 .../ V: H0 F) H5 _  Z
bltian 发表于 2013-2-25 19:52

5 l" t$ S+ \5 q. C0 v* `+ r2 [  \3 O' p( t# P0 F& m
在下面这一步, 不要输入 y 直接回车就行了:
- W- v/ l' s! E7 ~5 D/ g   Set wiki split size, default is 1230M(设置分割大小, 默认是按 1230M 分割.) [y/N]% M  Q0 {5 k- A" [, k

3 a; ]/ }2 J- }; E% J7 E7 I7 e下个版本 2.2.3 会使这些提示信息更清晰些.

该用户从未签到

 楼主| 发表于 2013-2-27 18:39:41 | 显示全部楼层
刚刚按照上述的方法试了下,应该可以转换了。
$ A: y  P# k3 }2 q9 ~$ j9 O. X% c  E6 I6 z: ~% r7 G& O1 X  \( u0 R
非常感谢,这个软件综合来看是目前最有前景的,速度快,转换简洁方便!) U+ g8 e7 L- M0 i$ M1 r2 E
  j6 b, E* h% Q! f, u1 z3 [
但是发现问题:
5 F5 r0 t6 [, d- n1 Q+ K7 K5 x& s0 W) t9 n, k  p: d, q8 G
1 默认的输出文件没有txt的后缀,似乎手机上无法识别,需要重新加上txt ?
. {/ S" w. P) K" G# r) w6 X( L3 ~! ^
# ]: w6 M, K, R" c2 手机的hace/fastwiki目录下,似乎只能识别一个词典,例如把中文维基百科和中文维基百科词典放到一个目录下,只能识别一个词典;* g0 V8 {) i' F) a7 W
6 @5 P$ P7 ^( l+ C% D4 c
另外,建议如下:9 i1 C2 I8 I* E1 {; r& @
& X: u$ c: `: `0 K0 r
1 每个词典的命名(输出文件名),最好区别一下,否则在电脑上转换后会覆盖前一个;由于原始文件名几乎是固定的,因此可以区别为:zh-中文,wiki-百科,wkt-维基词典,wks-维基资源,其他等等,例如:zh-wks-20130213;$ G! r7 b" X6 B6 x

2 D# u  [4 `4 p  Q6 Z/ s$ Y2 中文字体除了简体,繁体选项外,应该增加一个选项是:保留原始的字体;5 ^8 w/ ^5 g% {) _; A$ }
" D6 a9 B. U* v9 n
3 查询时,每个词条的第一行最好加上词典的名称,例如本条解释是:维基词典,百科,等;
& E; [# V  t( s1 J( V0 w( G  p, b7 W- _  H: q, F. k
4 如果一个目录里可以有不同的词典,则不需要区分en 或 zh, 应一并查询,就像mdict一样;
1 Q* ?' w1 R' s) O3 {3 R1 z
/ a: q% {0 q7 t" W  ~以上仅供参考,再一次感谢你的辛勤努力,期待你的优秀作品 !!

该用户从未签到

 楼主| 发表于 2013-2-27 19:31:48 | 显示全部楼层
本帖最后由 bltian 于 2013-2-27 21:38 编辑 # ]# |5 Z/ d# y: ]* M; f9 p
" z! D% h4 a% ]* N# _
再补充一点,在词典中解释的内容里,能否去掉各种语种的翻译,而只保留中文,英文。
$ M4 \6 P7 H  D
/ w4 W0 ~+ X' ^" S( F例如词典存在大量的小语种的翻译内容,{{ar}}, {{bg}}, {{it}} .......

该用户从未签到

发表于 2013-2-27 23:36:44 | 显示全部楼层
5# bltian
/ Q/ j' ~3 w4 i. s# F9 M
1 o) n4 h2 f0 [) d$ I% f欢迎使用及提建议~~. Y) U6 J2 G% @' i: \+ l
你的问题:
/ ?6 P! H9 p8 w; h6 [, C% ?/ z, ]1. 不需加上 txt 后缀的. 手机能够识别.  fastwiki 只认前缀, 不认后缀的.
9 _# X2 N1 G' b9 |+ l9 i" E' Y! j   如, 目前 fastwiki 能够识别以下面为前缀的文件:
+ ^! Y1 ?2 m; S" g   fastwiki.dat.6 n' `/ C, n4 s/ P8 `
   fastwiki.idx.' q, {6 h  J8 ], H! @
   fastwiki.math./ N1 F2 `' R. S6 }
   fastwiki.image.: j0 P6 J+ J5 d$ }4 U
2. fastwiki 文件由三个或四个字段组成, 其中第三个字段为 "语言标识", 这个"语言标识" 其实可以为任意字符串,
3 c, I5 Z4 M0 z+ H$ o# u" x' C: {   如, en, zh, zh1, zh2 等等, 这个语言标识是不能一样的.
$ f- b1 M# V& b) g" B# P
5 |  X5 t2 U" d7 d# i" P/ w你的建议:) Y9 r. @, h2 \3 t9 a1 b  u
1. 使用刚刚发布的转换工具  2.2.3 吧, 下载下来的文件不要改名, 直接给 2.2.3 转换即可,8 E( W% l' s9 Z7 V; |4 h2 i
   如 zhwikisource-20130215-pages-articles.xml.bz2 会直接输出:, n: `0 P) \9 s- Y% l! O1 T
   fastwiki.dat.zhisource.0+ g' U6 ~! f/ D3 c+ o$ T
   fastwiki.idx.zhisource2 {) L* X& \  x5 t  Z2 C
   不需要手工再输入其它信息了.
$ w# S! v; U5 o- C) |
. j# Z8 _# V' r  ]( b2. 目前只有转换简体和不转换两种模式, 还没有转成繁体这个功能. 不转换就是保留原有字体.
6 P0 b9 g* I" g! k1 z3. & 4.
7 L) a/ e9 f" \* r% N5 E6 [这两点是关于联合查询的.
5 Q4 x/ j0 w% B5 @1 \$ Y; s目前 fastwiki 主要完善维基功能, 联合查询暂时不支持. 主要原因有:# J0 H# X$ q5 O6 d6 S- R
a.. 某些词条非常大, 显示多个词典显得没有必要.6 {# Z, o# L; [( k% a; D
b. 很多在 zh 的条目在 en 并不存在.1 Y% |) G7 b: B

9 i0 z2 F# v' v5 |( i  v3 z等到软件完善后, 再考虑支持词典吧.

该用户从未签到

发表于 2013-2-27 23:39:14 | 显示全部楼层
再补充一点,在词典中解释的内容里,能否去掉各种语种的翻译,而只保留中文,英文。6 M/ U- z( J6 ]  C

) T1 ?, a3 I( M  J. v6 U+ c例如词典存在大量的小语种的翻译内容,{{ar}}, {{bg}}, {{it}} .......
3 D' ?$ j# z8 C9 A! Z" ubltian 发表于 2013-2-27 19:31
+ M6 ]- s5 ]4 j4 W- x
2 K/ {" Z- v3 ?
这些是因为目前还没有解析 维基当中的模板, 即类似 {{...}} 的内容.
" b- \- a9 k+ l* K这是一个重要的功能, 但目前还没有完成, 请耐心等待 :-)

该用户从未签到

 楼主| 发表于 2013-2-28 23:08:35 | 显示全部楼层
谢谢,我把词典的语言标识修改为zh1, en1, 与百科放在一个目录下,应该可以了.  D8 ?5 |* o  F" ~3 _
! j. p# M) g4 F* o; I
但又发现新的问题, 同为一个目录的百科显示无数据库,尽管在语言标识中有显示,点击语言标识en, 或zh后显示无数据或程序中止退出。百科是你网上的版本,程序是2.2.6- s% d& w/ q+ C, Y3 @
* h; o" g: C3 L8 ~
还是收藏的词条经常在程序岀错后清空。
: e* O- {. M2 T9 [6 C6 \" h7 |# c( P) y: s$ Y' o
已输入的词条在切换语言标识时,经常会消失,不得不重新输入。

该用户从未签到

发表于 2014-1-9 19:19:39 | 显示全部楼层
bltian 发表于 2013-2-28 23:08 / }; Q0 v! h4 O
谢谢,我把词典的语言标识修改为zh1, en1, 与百科放在一个目录下,应该可以了.
8 S1 P( X/ Q! n. g: i' q  F3 K% j! J8 o% e: _/ N9 `4 n0 N
但又发现新的问题, 同为一 ...

; w" x4 a! u( J! d0 Q我下了个16.2g的离线数据包,想转一下放到手机上用,2.2.3程序出错,用2.2.2转,大概要多久的呢

该用户从未签到

发表于 2014-1-10 10:25:27 | 显示全部楼层
hklbr 发表于 2014-1-9 19:19 : W. M( C. ]; l% A
我下了个16.2g的离线数据包,想转一下放到手机上用,2.2.3程序出错,用2.2.2转,大概要多久的呢
+ Z6 q; X3 k: k) G: k& p) W! V

: Z5 ?7 m) x  d' u" ~1. 是什么离线数据包啊? 给个链接?$ S2 S' g4 Z1 G& A
2. 出错? 出什么错?; r; e/ T% |2 U& T; S' ~& z7 Y
3. 转换英文的 9G 数据也只需 1~3个小时, 主要是 bzip2 解压太慢了. 不要用旧版本, 要用最新的版本, 如 2.2.3 . 旧版本是不维护的, 没有太多时间维护那么多版本啊.
& G) X7 L( L% K% a* r. j4 a4 b0 y4 a' G: w% A

0 x/ q6 O- ^6 ^' U4 v* F

该用户从未签到

发表于 2014-1-13 12:26:49 | 显示全部楼层
fastwiki 发表于 2014-1-10 10:25
) t* K- a) j& ~: C1. 是什么离线数据包啊? 给个链接?
, Q+ J8 n% Q! S9 w0 N2. 出错? 出什么错?% A2 i  P9 M6 G- [
3. 转换英文的 9G 数据也只需 1~3个小时, 主要 ...

4 n7 d( M2 q# I8 y7 a' o就是wiki的离线数据包,16.2G  bz2文件,用2.2.3转刚开始2分钟就提示停止运行了,win7 x64系统
* m# D/ T6 I3 Y
: D& x0 ~2 ]7 ^& M/ j用2.2.2的话挂一个晚上第二天早上起来也是提示停止运行

该用户从未签到

发表于 2014-1-15 10:50:19 | 显示全部楼层
hklbr 发表于 2014-1-13 12:26 1 |- {% x& e% c) \9 V3 u5 D$ a
就是wiki的离线数据包,16.2G  bz2文件,用2.2.3转刚开始2分钟就提示停止运行了,win7 x64系统* |5 Y( o: n; F/ D, T4 l! |1 f0 \
; f7 _0 l% q& J) s4 r
用2.2. ...
! s8 t  j( T% |/ g/ _

; _: h5 r% E/ J( J要下这个文件: enwiki-20140102-pages-articles.xml.bz2 9.8 GB( @/ k" e: G: v
http://dumps.wikimedia.org/enwik ... es-articles.xml.bz2! m0 K$ c8 b+ x$ _0 w( C

$ g% t  z6 {, m/ V9 z而不是其它的文件, 英文最大的也就是 9.8G, 没有 16.2G 的离线文件,
3 N& P& k2 U; x+ t$ M( r要认准 pages-articles.xml
& |2 ]. S' p/ ~* J
% \' b" o! W, h3 T5 B. m" `8 K
7 P5 I) I; b- ^! N

该用户从未签到

发表于 2014-1-17 09:05:01 | 显示全部楼层
fastwiki 发表于 2014-1-15 10:50
6 J9 V, z. E3 M8 ?5 I% _要下这个文件: enwiki-20140102-pages-articles.xml.bz2 9.8 GB
" L6 \+ A1 P+ l: A3 i/ ?$ ohttp://dumps.wikimedia.org/enwiki/2 ...
3 h0 {9 L' a" D( u/ R
zhwiki-20131120-pages-meta-history.xml.bz29 R1 a! `9 `; K4 P# z0 f" n
我下的是这个文件,难道不能用?我用这个转成wikitaxi的pc上的离线文件可用

该用户从未签到

发表于 2014-1-17 14:17:59 | 显示全部楼层
hklbr 发表于 2014-1-17 09:05 8 {1 q! I; E) n2 {, _1 A
zhwiki-20131120-pages-meta-history.xml.bz20 j# `, |8 ~# N/ E
我下的是这个文件,难道不能用?我用这个转成wikitaxi的pc ...

$ T3 z: F! U0 \4 Z8 {不是这个啊, zhwiki 的离线数据才 1G, 最新是
& k6 F' l+ l8 W( }, J; U4 R! }' i7 v' ahttp://dumps.wikimedia.org/zhwik ... es-articles.xml.bz2
' _9 [; z; A" {转换时不需要解压的, 直接运行 fastwiki-2.2.3.exe
( \" J) Z6 g! Z5 @# ^# |! p  }要认准 pages-articles.xml
8 p9 d6 {3 i( P9 y4 a2 ]+ n+ V7 c* a- y* r8 z3 i, g! O5 a- C
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2025-5-7 15:16 , Processed in 0.024225 second(s), 24 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表