holucan
发表于 2013-10-22 21:59:06
唔,最近发现,新的wiki资料从20131004至目前的20131019,已经无法制作了,
严格说来,也不算是无法制作,应该说由程序切割后成为41部份,然而1~39转换还算正常(包含修改过的二个)
到了40和41这二部份时,基本上就转不出所以然来,一下子就过了,且也没生成.txt
也就是说,最后结合的总成,只有1~39,并无40和41,虽然也OK啦,但总觉得少了什么不完全。
不晓得有解吗?
ttxx
发表于 2013-12-4 18:23:00
总之谢谢分享
ttxx
发表于 2013-12-4 18:23:17
总之谢谢分享
imfirefly
发表于 2014-1-8 09:56:52
谢谢分享!
zhwiki-******-pages-meta-current.xml.bz2 含图文吗?
你们一般用的dump是:zhwiki-******-pages-articles.xml.bz2 这种吗?
我看的地址是这里:http://dumps.wikimedia.org/zhwiki/20140106/
小白,求说明,谢谢!
i-wiki
发表于 2014-1-8 15:42:07
zhwiki-******-pages-meta-current.xml.bz2 不含图像的,离线包只需下载zhwiki-******-pages-articles.xml.bz2即可。
funcc
发表于 2014-3-26 13:55:48
i-wiki 发表于 2014-1-8 15:42 static/image/common/back.gif
zhwiki-******-pages-meta-current.xml.bz2 不含图像的,离线包只需下载zhwiki-******-pages-articles.xml. ...
藍岩鬣蜥 这个报错
imfirefly
发表于 2014-6-6 13:38:29
本帖最后由 imfirefly 于 2014-6-6 15:34 编辑
运行过程中出错,提示“溢出”。
注:前面已经按照说明拆分过xml的大小,分割了15个,有2个转换的时候出现上面的问题(弹出的错误提示都一样)。所以我估计是词条长度什么的出现了问题,建议引擎可以这样处理这种情况:提示是否跳过此词条或自动截断此词条(这只是我的猜测和不成熟的想法)。
abdallha
发表于 2014-7-12 15:15:03
本帖最后由 abdallha 于 2014-7-14 15:24 编辑
他乡游子 发表于 2013-6-17 12:55 static/image/common/back.gif
有些词无法解析
如:藍岩鬣蜥
神韵艺术团
我正在转换20140705的dump,在第17个文件碰到了“藍岩鬣蜥”,和楼上同学反映的一样程序出错了。经过反复试验,发现是在这一句中出错的:“ 另外,傳統的農地變更成畜牧的草場也影響藍岩鬣蜥的次級棲息地。<ref name="iucn">{{IUCN2006|assessors=Burton, F.J.|year=2004|id=44275|title=Cyclura lewisi|downloaded=9 May 2006}}</ref>”仔细研究后发现是该句中的标签<ref name="iucn">漏了加斜杠符号。于是用Ultraedit编辑该xml文件,将该标签改成<ref name="iucn"/>,以UTF-8格式保存,重新运行i-wiki引擎,就顺利通过了。
然后在第26个文件碰到“神韵艺术团”,报同样错。发现是在:“還有扇子、筷子和水袖等。<ref name="=A dazzling show with a clear message"/><ref name="Women flow like water in spectacle"/>{{cite news|language= {{en}} | author = Sid Smith | coauthors = | url =http://articles.chicagotribune.com/2008-01-28/features/0801270151_1_dance-chinese-traditional |title = Women flow like water in spectacle |publisher =Chicago tribune | pages =| date = 2008-01-28|accessdate = 2012-12-29|In many respects, the Chinese New Year Spectacular resoundingly lives up to its name. The term "spectacular" may whiff of self-promotion, but the show, which played Arie Crown Theater over the weekend, is indisputably a spectacle. Dozens of dancers and musicians flood the stage in a parade of brightly colored, intricately detailed silken costumes, while the instrumentation ranges from traditional drums to bunches of chopsticks.}}</ref>”这句出错,仔细研究后发现是该句中的标签<ref name="Women flow like water in spectacle"/>多加了一个斜杠符号,删去该斜杠,保存,重新运行,OK了。
abdallha
发表于 2014-7-12 15:30:36
shunza 发表于 2013-4-20 06:20 static/image/common/back.gif
点分解,出现
Run-time error '713':
这个只要在网上下载一下msstdfmt.dll文件,拷贝到系统盘里windows目录的System32目录(32位系统)或者SysWOW64目录(64位系统)下,然后在该目录下用管理员权限运行命令行命令regsvr32 msstdfmt.dll 即可。
abdallha
发表于 2014-7-15 17:34:57
本帖最后由 abdallha 于 2014-7-15 17:36 编辑
abdallha 发表于 2014-7-12 15:15 static/image/common/back.gif
我正在转换20140705的dump,在第17个文件碰到了“藍岩鬣蜥”,和楼上同学反映的一样程序出错了。经过反 ...
另外把我这次碰到的问题汇总如下,以便i-wiki前辈改进程序的话可用:
1)词条“蓝岩蜥蜴”中有个标签缺少斜杠符号“/”,导致程序出错,添加“/”后正常;
2)词条“神韵艺术团”中某个标签多了一个斜杠符号“/”,导致程序出错,删除“/”后正常;
3)引擎分割原数据文件生成的最后一个xml文件中,缺失</page></wikimedia>标签,导致程序忽略该文件,手动修改补足后正常。
4)部分重定向跳转链接失效,究其原因是:转换引擎误认为跳转语句“#重定向”为普通文本,导致没有转换成链接,替换成“#Redirect”便恢复正常。
20140705的下载帖子在:https://www.pdawiki.com/forum/thread-12782-1-1.html
shunza
发表于 2014-7-26 07:14:13
abdallha 发表于 2014-7-12 15:30 static/image/common/back.gif
这个只要在网上下载一下msstdfmt.dll文件,拷贝到系统盘里windows目录的System32目录(32位系统)或者Sys ...
謝謝,這下徹底解決了問題
shinsenlin
发表于 2014-10-28 22:07:13
glsgls123 发表于 2012-8-21 14:15
楼主~转换日文wiki,到part7 “捕手”出现这个怎么办?在google上查了一下,有一种可能是地区码设置引起 ...
直接在源文件里把这个捕手条目删除就好了。有2个。
i-wiki
发表于 2015-4-19 21:53:55
imfirefly
发表于 2015-7-31 11:32:35
你好,我最近用i-wiki引擎转换了“维基词典”,对i-wiki 引擎有一些想法,顺便写在这里了:https://www.pdawiki.com/forum/forum.php?mod=redirect&goto=findpost&ptid=13972&pid=208502&fromuid=174639
欢迎交流!
jho91721
发表于 2015-12-8 15:26:30
无限感谢,之前一直没用,现在发现受益匪浅。
最可爱的人渣
发表于 2016-1-15 12:41:55
很厉害
qqqwppp
发表于 2016-4-10 18:31:27
发现牛人一个,呵呵
itakeatry
发表于 2016-4-30 04:19:41
受教了!!!感謝教學
swifer
发表于 2016-5-2 08:13:29
英文版wiki貌似实用点
Lynsanity
发表于 2016-5-31 11:53:59
非常感谢您的无私分享!辛苦了!
kath000erine
发表于 2016-8-2 15:54:02
{:12_443:}
hz6128
发表于 2016-12-24 23:31:28
感谢分享。。。。
kandict
发表于 2017-1-19 12:33:05
i-wiki 发表于 2015-4-19 21:53
希望早日能让大家用上.
目前为止似乎效果最好的还是你2012压的wiki.
Wind508
发表于 2017-1-21 22:15:31
谢谢分享
SHGKG
发表于 2017-2-8 14:18:39
学习一下