掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

楼主: i-wiki

[工具] 分享:i-wiki的中文WJ新引擎及教程

[复制链接]

该用户从未签到

发表于 2013-10-22 21:59:06 | 显示全部楼层
唔,最近发现,新的wiki资料从20131004至目前的20131019,已经无法制作了,4 K% U, w+ D/ D6 k  A* F  s
严格说来,也不算是无法制作,应该说由程序切割后成为41部份,然而1~39转换还算正常(包含修改过的二个)2 m4 u  c9 ^) V/ n
到了40和41这二部份时,基本上就转不出所以然来,一下子就过了,且也没生成.txt
$ ^/ Q" E, M+ z: T( o9 X也就是说,最后结合的总成,只有1~39,并无40和41,虽然也OK啦,但总觉得少了什么不完全。
) {2 z( `  F+ w0 [1 b5 w' ?不晓得有解吗?

该用户从未签到

发表于 2013-12-4 18:23:00 | 显示全部楼层
总之谢谢分享

该用户从未签到

发表于 2013-12-4 18:23:17 | 显示全部楼层
总之谢谢分享

该用户从未签到

发表于 2014-1-8 09:56:52 | 显示全部楼层
谢谢分享!8 K9 h1 D& |+ m) P

) f4 C. Z& R; b$ Z8 C8 ?0 Vzhwiki-******-pages-meta-current.xml.bz2 含图文吗?
3 \$ o9 i& F7 w! n5 S$ M
! K/ r$ j% J( v, ^0 J你们一般用的dump是:zhwiki-******-pages-articles.xml.bz2 这种吗?
$ C1 U6 r* q  u* Y
( |( i2 M- p+ S, L( c4 Z我看的地址是这里:http://dumps.wikimedia.org/zhwiki/20140106/
9 n! |6 ?; [, E5 S
3 X% q/ I+ t, a# Z0 U- J5 j* m小白,求说明,谢谢!

该用户从未签到

 楼主| 发表于 2014-1-8 15:42:07 | 显示全部楼层
zhwiki-******-pages-meta-current.xml.bz2 不含图像的,离线包只需下载zhwiki-******-pages-articles.xml.bz2即可。

该用户从未签到

发表于 2014-3-26 13:55:48 | 显示全部楼层
i-wiki 发表于 2014-1-8 15:42
9 I2 G1 Z7 g( {( |: P; }( @8 @zhwiki-******-pages-meta-current.xml.bz2 不含图像的,离线包只需下载zhwiki-******-pages-articles.xml. ...

% L" J8 b0 }2 y
2 @& v; f6 r6 o) O+ _4 G
& q+ l1 S8 R) D# g* b4 ]8 z4 N藍岩鬣蜥 这个报错
( j2 I9 i1 J; _* e+ J3 V

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2014-6-6 13:38:29 | 显示全部楼层
本帖最后由 imfirefly 于 2014-6-6 15:34 编辑
4 I3 w2 [6 a4 Y2 ]5 J8 ^0 J6 K1 H2 U- i+ o3 G# w7 b& X
运行过程中出错,提示“溢出”。
* n) }5 S6 Q2 \7 H& o# z5 k" c5 U  p: L& F

) k5 Q; Z5 M9 U" r$ q, X: x6 O4 X注:前面已经按照说明拆分过xml的大小,分割了15个,有2个转换的时候出现上面的问题(弹出的错误提示都一样)。所以我估计是词条长度什么的出现了问题,建议引擎可以这样处理这种情况:提示是否跳过此词条或自动截断此词条(这只是我的猜测和不成熟的想法)。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2014-7-12 15:15:03 | 显示全部楼层
本帖最后由 abdallha 于 2014-7-14 15:24 编辑 5 M; f8 s7 U  Q. y
他乡游子 发表于 2013-6-17 12:55
" }2 f+ @; m# H( W2 m9 I$ {3 q有些词无法解析
# a" B; g% }/ W( }9 u; z如:藍岩鬣蜥; ]8 E+ T4 t# _* `9 p
    神韵艺术团

- r, \' F" h3 b9 Z; j; V4 w6 {4 h9 H3 X% [
我正在转换20140705的dump,在第17个文件碰到了“藍岩鬣蜥”,和楼上同学反映的一样程序出错了。经过反复试验,发现是在这一句中出错的:
  1. “ 另外,傳統的農地變更成畜牧的草場也影響藍岩鬣蜥的次級棲息地。<ref name="iucn">{{IUCN2006|assessors=Burton, F.J.|year=2004|id=44275|title=Cyclura lewisi|downloaded=9 May 2006}}</ref>”
复制代码
仔细研究后发现是该句中的标签<ref name="iucn">漏了加斜杠符号。于是用Ultraedit编辑该xml文件,将该标签改成<ref name="iucn"/>,以UTF-8格式保存,重新运行i-wiki引擎,就顺利通过了。& F' f( t' O1 A( h$ U
5 C& }( h& Y! ^- G: ^$ }
然后在第26个文件碰到“神韵艺术团”,报同样错。发现是在:
  1. “還有扇子、筷子和水袖等。<ref name="=A dazzling show with a clear message"/><ref name="Women flow like water in spectacle"/>{{cite news|language= {{en}} | author = Sid Smith | coauthors = | url =http://articles.chicagotribune.com/2008-01-28/features/0801270151_1_dance-chinese-traditional |title = Women flow like water in spectacle |publisher =Chicago tribune | pages =| date = 2008-01-28|accessdate = 2012-12-29|In many respects, the Chinese New Year Spectacular resoundingly lives up to its name. The term "spectacular" may whiff of self-promotion, but the show, which played Arie Crown Theater over the weekend, is indisputably a spectacle. Dozens of dancers and musicians flood the stage in a parade of brightly colored, intricately detailed silken costumes, while the instrumentation ranges from traditional drums to bunches of chopsticks.}}</ref>”
复制代码
这句出错,仔细研究后发现是该句中的标签<ref name="Women flow like water in spectacle"/>多加了一个斜杠符号,删去该斜杠,保存,重新运行,OK了。
0 o' p( y0 ?) F5 s7 y

该用户从未签到

发表于 2014-7-12 15:30:36 | 显示全部楼层
shunza 发表于 2013-4-20 06:20
) M, g; [$ m' c+ `+ u+ ~点分解,出现4 |- D" O) T4 @' |' `7 Q
Run-time error '713':
7 W; m* A! r- a
这个只要在网上下载一下msstdfmt.dll文件,拷贝到系统盘里windows目录的System32目录(32位系统)或者SysWOW64目录(64位系统)下,然后在该目录下用管理员权限运行命令行命令regsvr32 msstdfmt.dll 即可。

该用户从未签到

发表于 2014-7-15 17:34:57 | 显示全部楼层
本帖最后由 abdallha 于 2014-7-15 17:36 编辑 9 b$ r+ o6 _# x- z% y9 f" [
abdallha 发表于 2014-7-12 15:15 % E5 b3 z% W0 {- ]
我正在转换20140705的dump,在第17个文件碰到了“藍岩鬣蜥”,和楼上同学反映的一样程序出错了。经过反 ...

0 _; c2 X* w+ Q4 n, I) C: m+ l3 Z7 C
另外把我这次碰到的问题汇总如下,以便i-wiki前辈改进程序的话可用:
' J- P' M/ c. \. a1 J9 R; `2 Q
# w$ ]! P, S$ a# n1)词条“蓝岩蜥蜴”中有个标签缺少斜杠符号“/”,导致程序出错,添加“/”后正常;
$ V# |. m5 c% v. w3 V# O1 n2)词条“神韵艺术团”中某个标签多了一个斜杠符号“/”,导致程序出错,删除“/”后正常;3 i2 h3 _, m1 }. ~* V9 g
3)引擎分割原数据文件生成的最后一个xml文件中,缺失</page></wikimedia>标签,导致程序忽略该文件,手动修改补足后正常。1 Q. U1 r2 N( Y1 Y( i
4)部分重定向跳转链接失效,究其原因是:转换引擎误认为跳转语句“#重定向”为普通文本,导致没有转换成链接,替换成“#Redirect”便恢复正常。
9 Z1 a( _) D; Y* ]
: w5 K( s3 q" \8 u% n. Q' X20140705的下载帖子在:https://www.pdawiki.com/forum/thread-12782-1-1.html
- K$ z! |8 i+ N8 p1 F% O. y3 h2 u. o, ]
  • TA的每日心情
    开心
    2021-8-15 12:56
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-7-26 07:14:13 | 显示全部楼层
    abdallha 发表于 2014-7-12 15:30 9 Z* ^- V2 V7 L  S+ ]+ j
    这个只要在网上下载一下msstdfmt.dll文件,拷贝到系统盘里windows目录的System32目录(32位系统)或者Sys ...

    , Y% ^* o6 d4 F. m5 T$ }1 g謝謝,這下徹底解決了問題
  • TA的每日心情
    开心
    2018-4-28 13:02
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-10-28 22:07:13 | 显示全部楼层
    glsgls123 发表于 2012-8-21 14:150 @$ {1 s! V( r, {5 _' o
    楼主~转换日文wiki,到part7 “捕手”出现这个怎么办?在google上查了一下,有一种可能是地区码设置引起 ...

      d8 Y' L" [: ^( {$ x9 r直接在源文件里把这个捕手条目删除就好了。有2个。

    该用户从未签到

     楼主| 发表于 2015-4-19 21:53:55 | 显示全部楼层

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2015-7-31 11:32:35 | 显示全部楼层
    你好,我最近用i-wiki引擎转换了“维基词典”,对i-wiki 引擎有一些想法,顺便写在这里了:https://www.pdawiki.com/forum/fo ... &fromuid=174639
    % S/ O# `2 ]1 [& }8 W# ^# w( H+ ?2 W1 X8 N( z) r+ S# K
    欢迎交流!

    该用户从未签到

    发表于 2015-12-8 15:26:30 | 显示全部楼层
    无限感谢,之前一直没用,现在发现受益匪浅。

    该用户从未签到

    发表于 2016-4-10 18:31:27 | 显示全部楼层
    发现牛人一个,呵呵
  • TA的每日心情
    开心
    2019-6-3 07:56
  • 签到天数: 61 天

    [LV.6]常住居民II

    发表于 2016-4-30 04:19:41 | 显示全部楼层
    受教了!!!感謝教學

    该用户从未签到

    发表于 2016-5-2 08:13:29 来自手机 | 显示全部楼层
    英文版wiki貌似实用点

    该用户从未签到

    发表于 2016-5-31 11:53:59 | 显示全部楼层
    非常感谢您的无私分享!辛苦了!

    该用户从未签到

    发表于 2017-1-19 12:33:05 | 显示全部楼层
    8 L/ `- p8 [" @7 S+ Y0 L5 y
    希望早日能让大家用上.
    ! `4 }9 X8 r5 `  z目前为止似乎效果最好的还是你2012压的wiki.
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-29 04:00 , Processed in 0.252188 second(s), 8 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表