掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 10623|回复: 10

[教程] Mdict维基资源制作简易教程

[复制链接]

该用户从未签到

发表于 2012-3-1 17:41:02 | 显示全部楼层 |阅读模式
本帖最后由 philostone 于 2012-3-1 17:51 编辑 5 G" ]- ^& _3 A$ e

2 D  G" q/ n* z$ U% k1 t2 q7 W4 O6 b* I  v1 R" T0 _2 X
一、准备维基资源数据文件
' R/ ^8 N1 v" \# S
1. 登陆维基资源数据网站http://dumps.wikimedia.org/backup-index.html
& _; C3 k! V9 _# R2 d2. 在该网页上查找想要的维基资源(可以用ctrl+f快捷方式),中文代码为zh,意大利文代码是it,zhwiki就是中文维基百科的数据,itwiki就是意大利文的维基百科数据;: J# [8 L% H5 i* {# t
3. 在具体资源网页上下载文件结尾含pages-articles.xml.bz2的文件;6 h4 W8 y3 M& b4 l3 z4 f7 \
4. 下载后解压出文件结尾含pages-articles.xml的文件,把文件名中pages-articles.xml前的部分删掉。
, |6 b% W; |9 L, Y/ r1 B  h# f5 b9 Y" ^1 Y, H
二、准备并使用xml转txt的工具,这种工具很多,操作最简单的主要有两种:5 [4 K  }7 ~  }
1. WikiToMDict2.0.exe 下载地址http://115.com/file/dpdhh53x#
5 G8 x( B* M& C9 g: g; {在DOS下(CMD下)转到工具所在目录,(不管转何种语言的何种维基资源)键入wikitomdict2.0执行转换;
* Y5 @  r5 k4 a. q/ G- u2 H9 W2. Wiki2TXTv2.1.exe 下载地址http://115.com/file/e73kk63j#. S4 ^8 w2 }7 L9 ^4 }
在DOS下(CMD下)转到工具所在目录,键入wiki2txtv2.1 it wp(注意it前后各有一个空格)。其中it 表示意大利语,如果你转的是中文资源需要用zh 代替it;wp表示百科,如果你转的是文库,则应键入ws。" o  c; \/ k' S* b- s/ V+ a
3. 等待一定时间即可完成格式转换(转好的txt文件可以重命名)。. w8 {7 v* x9 `/ j' M  Y
9 o( a# A9 V4 B) H$ v! b: W
三、用Mdxbuilder转换TXT文件为MDX文件  u0 F6 @, w( x. i" e3 a
1. 下载最新版的Mdxbuilder程序文件,$ w: I( M5 M# y6 f0 }
2. 在source栏浏览找到转好的txt文件,在Target栏键入想要转换成的mdx文件名(及其路径),style栏可以留空,data栏是在有图片、声音等其他附属文件时才用的,如果有这类文件,输入其所在地址和文件名,original format一般选 MDict(Html),encording一般默认选UTF-8(Unicode),但在法语等语种最好用UTF-16,当然相应的上面的txt也得先打开另存或用其他工具转为UTF-16编码;Title就随便写个标题了;Description主要是词典封面设计,可有可无,了解些html语言,如同设计网页一样可以把词典封面设计得很漂亮,比如你在data所指的文件夹中存了个名为X的图片,你就可以用<img src="/X">把图片弄到封面上……9 e: W# }/ R$ Z1 m
这些完成后点start就开始转换了,依文件大小时间长短不等。
* F6 |3 i0 z! S5 H0 r# a- S- C' Z( k/ l/ U* }& ^
四、可能遇到的问题
- q/ X! e  d6 U' {3 W* R
1. 如果转换时出现词条名过长的错误,就得按Mdxbuilder提示的位置,打开txt文件查找修改。打开大txt文件推荐使用uedit32(请自己到软件网站或利用迅雷等下载工具下载新版本来使用)。打开文档后,首先ctrl+h切换成十六进制模式,再ctrl+g 输入Mdxbuilder提示的出错位置并查找,然后再ctrl+h切换成文本模式找到对应位置对词条标题进行修正。修正时,如果不好确定词条名,建议到http://www.wikipedia.org/,在相应语种维基资源下,粘贴入从该问题词条中复制的一段正文来找到词条标题。; o# {8 X6 A1 W4 ?
2. 下载解压后的XML文件过大,比如英、德、法等语种的维基资源,可以使用Split.exe这个程序(下载地址http://115.com/file/be6dijue#)来劈成多个部分来转为txt,再用TextForever.exe这个软件(下载地址http://115.com/file/dpdh0bl8#)来合并。
0 t3 u0 w. z1 h2 x0 a, l4 Y0 ^+ h1 p- h3 }

5 ]: c5 Q) l& e, E: D, k; D附:ISO 639-1语言及代码
9 r: J4 z4 F; \3 L6 K3 e
aa阿法尔语fr法语li林堡语se北萨米语
ab阿布哈兹语fy弗里西亚语ln林加拉语sg桑戈语
ae阿维斯陀语ga爱尔兰语lo老挝语sh塞尔维亚-克罗地亚语
af阿非利堪斯语gd苏格兰盖尔语lt立陶宛语si僧加罗语
ak阿坎语gl加利西亚语lu卢巴-加丹加语sk斯洛伐克语
am阿姆哈拉语gn瓜拉尼语lv拉脱维亚语sl斯洛文尼亚语
an阿拉贡语gu古吉拉特语mg马达加斯加语sm萨摩亚语
ar阿拉伯语gv马恩岛语mh马绍尔语sn绍纳语
as阿萨姆语ha豪萨语mi毛利语so索马里语
av阿瓦尔语he希伯来语mk马其顿语sq阿尔巴尼亚语
ay艾马拉语hi印地语ml马拉亚拉姆语sr塞尔维亚语
az阿塞拜疆语ho希里莫图语mn蒙古语ss斯瓦特语
ba巴什基尔语hr克罗地亚语mo摩尔达维亚语st南索托语
be白俄罗斯语ht海地克里奥尔语mr马拉提语su巽他语
bg保加利亚语hu匈牙利语ms马来语sv瑞典语
bh比哈尔语hy亚美尼亚语mt马耳他语sw斯瓦希里语
bi比斯拉马语hz赫雷罗语my缅甸语ta泰米尔语
bm班巴拉语ia国际语Ana瑙鲁语te泰卢固语
bn孟加拉语id印尼语nb书面挪威语tg塔吉克语
bo藏语ie国际语End北恩德贝勒语th泰语
br布列塔尼语ig伊博语ne尼泊尔语ti提格里尼亚语
bs波斯尼亚语ii四川彝语(诺苏语)ng恩敦加语tk土库曼语
ca加泰隆语ik依努庇克语nl荷兰语tl他加禄语
ce车臣语io伊多语nn新挪威语tn塞茨瓦纳语
ch查莫罗语is冰岛语no挪威语to汤加语
co科西嘉语it意大利语nr南恩德贝勒语tr土耳其语
cr克里语iu因纽特语nv纳瓦霍语ts宗加语
cs捷克语ja日语ny尼扬贾语tt塔塔尔语
cu古教会斯拉夫语jv爪哇语oc奥克语tw特威语
cv楚瓦什语ka格鲁吉亚语oj奥吉布瓦语ty塔希提语
cy威尔士语kg刚果语om奥洛莫语ug维吾尔语
da丹麦语ki基库尤语or奥利亚语uk乌克兰语
de德语kj宽亚玛语os奥塞梯语ur乌尔都语
dv迪维希语kk哈萨克语pa旁遮普语uz乌兹别克语
dz不丹语kl格陵兰语pi巴利语ve文达语
ee埃维语km高棉语pl波兰语vi越南语
el现代希腊语kn卡纳达语ps普什图语vo沃拉普克语
en英语ko朝鲜语、韩语pt葡萄牙语wa沃伦语
eo世界语kr卡努里语qu凯楚亚语wo沃洛夫语
es西班牙语ks克什米尔语rm罗曼什语xh科萨语
et爱沙尼亚语ku库尔德语rn基隆迪语yi依地语
eu巴斯克语kv科米语ro罗马尼亚语yo约鲁巴语
fa波斯语kw康沃尔语ru俄语za壮语
ff富拉语ky吉尔吉斯语rw基尼阿万达语zh中文、汉语
fi芬兰语la拉丁语sa梵语zu祖鲁语
fj斐济语lb卢森堡语sc撒丁语  
fo法罗语lg干达语sd信德语  
  • TA的每日心情
    开心
    2018-7-14 15:08
  • 签到天数: 11 天

    [LV.3]偶尔看看II

    发表于 2012-3-1 21:11:42 | 显示全部楼层
    制作精美的维基百科在哪里呢?
  • TA的每日心情
    开心
    2019-2-8 13:36
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    发表于 2012-3-4 20:22:10 | 显示全部楼层
    感谢分享制作教程。

    该用户从未签到

    发表于 2012-3-21 11:28:51 | 显示全部楼层
    前排支持,强力教程!

    该用户从未签到

    发表于 2012-3-22 09:12:22 | 显示全部楼层
    非常感谢分享,正想学习一下。
  • TA的每日心情
    无聊
    2020-8-18 23:52
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    发表于 2012-4-1 22:43:40 | 显示全部楼层
    好复杂的样子,不过非常感谢

    该用户从未签到

    发表于 2012-4-14 20:11:07 | 显示全部楼层
    {:soso_e163:}{:soso_e183:}
    ; u4 }& R9 l- h( [* R( a刚刚分别用2.0和2.1试做了下粤语维基百科,方法比较傻瓜很简单。希望以后有时间多深入学习如何制作。

    该用户从未签到

    发表于 2012-4-16 19:32:45 | 显示全部楼层
    谢谢版主!- e+ a) O% ]' Z3 F  P
    . G; b2 O$ z8 s- x9 D
    正在下载 学习中。。。。。

    该用户从未签到

    发表于 2012-4-25 10:11:43 | 显示全部楼层
    请问那种带有几个GB的图片资源mdd文件的wiki是如何制作的?

    该用户从未签到

    发表于 2012-5-3 12:28:50 | 显示全部楼层
    楼主我遇到一些问题,希望可以解答一下:
    3 O1 L* l; g! B( Y7 S# N; S4 U4 \0 o- {% t) X7 J) G
    转换时出现词条名过长的错误了,我转的是日语的危机,解压后xml就6GB大,UltraEdit打开很慢,而且占C盘缓存,还没有开完就死机了。之后用PilotEdit打开是打开了,可是乱码,不知道怎么改此条目过长。
    + G* ?3 }7 |- N/ Z0 r
    2 ^$ y  z, R& Z: k& G# H9 q请问楼主具体是怎样解决大文件问题的?莫非电脑很好?

    该用户从未签到

    发表于 2012-5-17 14:07:40 | 显示全部楼层
    想制作带图版的,该怎么做?
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-3-29 04:00 , Processed in 0.135892 second(s), 14 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表