掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

楼主: i-wiki

[工具] 分享:i-wiki的中文WJ新引擎及教程

[复制链接]

该用户从未签到

发表于 2013-10-22 21:59:06 | 显示全部楼层
唔,最近发现,新的wiki资料从20131004至目前的20131019,已经无法制作了,& Q6 R4 ^! {& H3 U3 O
严格说来,也不算是无法制作,应该说由程序切割后成为41部份,然而1~39转换还算正常(包含修改过的二个)
( W4 e4 p7 F$ K" V7 {8 Z6 g/ t到了40和41这二部份时,基本上就转不出所以然来,一下子就过了,且也没生成.txt
% |! F0 A8 b2 `& K+ Y- H" A) [也就是说,最后结合的总成,只有1~39,并无40和41,虽然也OK啦,但总觉得少了什么不完全。7 {* ~6 [* _" g% W9 I. ?, z7 g8 t: a
不晓得有解吗?

该用户从未签到

发表于 2013-12-4 18:23:00 | 显示全部楼层
总之谢谢分享

该用户从未签到

发表于 2013-12-4 18:23:17 | 显示全部楼层
总之谢谢分享

该用户从未签到

发表于 2014-1-8 09:56:52 | 显示全部楼层
谢谢分享!
' h2 v, @/ x* J6 G" W
  D" |' `* \* lzhwiki-******-pages-meta-current.xml.bz2 含图文吗?  u  E1 E' T. A, q" J- I# @

# t; z9 S& e) C你们一般用的dump是:zhwiki-******-pages-articles.xml.bz2 这种吗?+ l& A1 L) O# D2 J8 n8 @7 P

. M% E; n- k( c; h: W0 i4 v9 U- t我看的地址是这里:http://dumps.wikimedia.org/zhwiki/20140106/
/ W% f0 [/ I8 Y* p6 o( g: [+ G. A  _/ W" h
小白,求说明,谢谢!

该用户从未签到

 楼主| 发表于 2014-1-8 15:42:07 | 显示全部楼层
zhwiki-******-pages-meta-current.xml.bz2 不含图像的,离线包只需下载zhwiki-******-pages-articles.xml.bz2即可。

该用户从未签到

发表于 2014-3-26 13:55:48 | 显示全部楼层
i-wiki 发表于 2014-1-8 15:42 " t. N$ @6 F+ J' s2 {
zhwiki-******-pages-meta-current.xml.bz2 不含图像的,离线包只需下载zhwiki-******-pages-articles.xml. ...

6 D0 ]4 h+ S$ I' G# g+ r: S% ~1 F; y/ n
' @% f) a- T' \+ T) I
藍岩鬣蜥 这个报错0 w1 p: k0 }0 s

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2014-6-6 13:38:29 | 显示全部楼层
本帖最后由 imfirefly 于 2014-6-6 15:34 编辑 + f1 `# M0 N6 X

7 V$ Q9 }6 I' C6 L/ R/ d9 b运行过程中出错,提示“溢出”。5 C, Q9 _0 B$ W. h" n

) K( e& F& }1 @0 D8 Z/ Z: v2 G& R  ~; F+ u
注:前面已经按照说明拆分过xml的大小,分割了15个,有2个转换的时候出现上面的问题(弹出的错误提示都一样)。所以我估计是词条长度什么的出现了问题,建议引擎可以这样处理这种情况:提示是否跳过此词条或自动截断此词条(这只是我的猜测和不成熟的想法)。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2014-7-12 15:15:03 | 显示全部楼层
本帖最后由 abdallha 于 2014-7-14 15:24 编辑 ( ]4 B" f$ B6 ?0 L" D
他乡游子 发表于 2013-6-17 12:55 # |/ I3 m* }. `6 H8 X
有些词无法解析- p. q5 |) p/ ~
如:藍岩鬣蜥. s5 z$ v" o* H' L1 c, E
    神韵艺术团

' M9 I+ u( m& t/ ~: D) I. b, M# @
+ Y; ~; N) i2 r我正在转换20140705的dump,在第17个文件碰到了“藍岩鬣蜥”,和楼上同学反映的一样程序出错了。经过反复试验,发现是在这一句中出错的:
  1. “ 另外,傳統的農地變更成畜牧的草場也影響藍岩鬣蜥的次級棲息地。<ref name="iucn">{{IUCN2006|assessors=Burton, F.J.|year=2004|id=44275|title=Cyclura lewisi|downloaded=9 May 2006}}</ref>”
复制代码
仔细研究后发现是该句中的标签<ref name="iucn">漏了加斜杠符号。于是用Ultraedit编辑该xml文件,将该标签改成<ref name="iucn"/>,以UTF-8格式保存,重新运行i-wiki引擎,就顺利通过了。
. Q! D& @+ G1 {6 y
- z' u: S9 Z0 B# l1 g2 Z+ T' g然后在第26个文件碰到“神韵艺术团”,报同样错。发现是在:
  1. “還有扇子、筷子和水袖等。<ref name="=A dazzling show with a clear message"/><ref name="Women flow like water in spectacle"/>{{cite news|language= {{en}} | author = Sid Smith | coauthors = | url =http://articles.chicagotribune.com/2008-01-28/features/0801270151_1_dance-chinese-traditional |title = Women flow like water in spectacle |publisher =Chicago tribune | pages =| date = 2008-01-28|accessdate = 2012-12-29|In many respects, the Chinese New Year Spectacular resoundingly lives up to its name. The term "spectacular" may whiff of self-promotion, but the show, which played Arie Crown Theater over the weekend, is indisputably a spectacle. Dozens of dancers and musicians flood the stage in a parade of brightly colored, intricately detailed silken costumes, while the instrumentation ranges from traditional drums to bunches of chopsticks.}}</ref>”
复制代码
这句出错,仔细研究后发现是该句中的标签<ref name="Women flow like water in spectacle"/>多加了一个斜杠符号,删去该斜杠,保存,重新运行,OK了。
  z, _& u$ O+ h: v3 [

该用户从未签到

发表于 2014-7-12 15:30:36 | 显示全部楼层
shunza 发表于 2013-4-20 06:20
8 ]8 ]# g* i) l4 D7 s* F$ |点分解,出现- v8 x! X9 ?) \5 p# I$ b2 P+ |2 ?( h
Run-time error '713':
+ `) Z& K( g3 |# I
这个只要在网上下载一下msstdfmt.dll文件,拷贝到系统盘里windows目录的System32目录(32位系统)或者SysWOW64目录(64位系统)下,然后在该目录下用管理员权限运行命令行命令regsvr32 msstdfmt.dll 即可。

该用户从未签到

发表于 2014-7-15 17:34:57 | 显示全部楼层
本帖最后由 abdallha 于 2014-7-15 17:36 编辑
0 G( Z% N- H0 _8 S$ w- M. H0 y3 N
abdallha 发表于 2014-7-12 15:15
7 ]8 ]! S& u6 R2 Q, B% ~: \- \我正在转换20140705的dump,在第17个文件碰到了“藍岩鬣蜥”,和楼上同学反映的一样程序出错了。经过反 ...

$ ?/ ~$ X  M' \% X' ]+ c+ M) w' ~+ {. ^
另外把我这次碰到的问题汇总如下,以便i-wiki前辈改进程序的话可用:
2 h5 p0 Y. e% W. d; V
: s2 K6 y5 i- K1)词条“蓝岩蜥蜴”中有个标签缺少斜杠符号“/”,导致程序出错,添加“/”后正常;
. e% h, a$ d2 I0 q+ |: {2)词条“神韵艺术团”中某个标签多了一个斜杠符号“/”,导致程序出错,删除“/”后正常;
) {! B9 j' ~; g" Q. `; L2 S' T3)引擎分割原数据文件生成的最后一个xml文件中,缺失</page></wikimedia>标签,导致程序忽略该文件,手动修改补足后正常。
) N% ^+ ?* c' T0 q2 k6 c& X4)部分重定向跳转链接失效,究其原因是:转换引擎误认为跳转语句“#重定向”为普通文本,导致没有转换成链接,替换成“#Redirect”便恢复正常。, Z1 L  P1 S# T) j
) W9 F0 M+ w! Y- z! I
20140705的下载帖子在:https://www.pdawiki.com/forum/thread-12782-1-1.html
) ~- p# q: h% B1 F1 f
  • TA的每日心情
    开心
    2021-8-15 12:56
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-7-26 07:14:13 | 显示全部楼层
    abdallha 发表于 2014-7-12 15:30
    1 h9 b/ M/ F# W) ?0 K9 G6 R这个只要在网上下载一下msstdfmt.dll文件,拷贝到系统盘里windows目录的System32目录(32位系统)或者Sys ...

    " e" z" F% k# S5 a3 Z( |謝謝,這下徹底解決了問題
  • TA的每日心情
    开心
    2018-4-28 13:02
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-10-28 22:07:13 | 显示全部楼层
    glsgls123 发表于 2012-8-21 14:15% q! {# [( Q8 i9 }* S4 E
    楼主~转换日文wiki,到part7 “捕手”出现这个怎么办?在google上查了一下,有一种可能是地区码设置引起 ...

    - z4 [6 M% O: q1 L直接在源文件里把这个捕手条目删除就好了。有2个。

    该用户从未签到

     楼主| 发表于 2015-4-19 21:53:55 | 显示全部楼层

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2015-7-31 11:32:35 | 显示全部楼层
    你好,我最近用i-wiki引擎转换了“维基词典”,对i-wiki 引擎有一些想法,顺便写在这里了:https://www.pdawiki.com/forum/fo ... &fromuid=174639
    , P9 U' X5 r8 p- D) q- ?3 V1 R" n7 L
    欢迎交流!

    该用户从未签到

    发表于 2015-12-8 15:26:30 | 显示全部楼层
    无限感谢,之前一直没用,现在发现受益匪浅。

    该用户从未签到

    发表于 2016-4-10 18:31:27 | 显示全部楼层
    发现牛人一个,呵呵
  • TA的每日心情
    开心
    2019-6-3 07:56
  • 签到天数: 61 天

    [LV.6]常住居民II

    发表于 2016-4-30 04:19:41 | 显示全部楼层
    受教了!!!感謝教學

    该用户从未签到

    发表于 2016-5-2 08:13:29 来自手机 | 显示全部楼层
    英文版wiki貌似实用点

    该用户从未签到

    发表于 2016-5-31 11:53:59 | 显示全部楼层
    非常感谢您的无私分享!辛苦了!

    该用户从未签到

    发表于 2017-1-19 12:33:05 | 显示全部楼层

    9 I/ b5 z/ c3 g" V1 [希望早日能让大家用上.
    6 |. b' L5 `( n( U3 \0 C( I3 j  d目前为止似乎效果最好的还是你2012压的wiki.
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2026-6-5 17:34 , Processed in 0.020665 second(s), 16 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表