掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 4315|回复: 17

[经验交流] “小满字典”词库制作初级教程

[复制链接]

该用户从未签到

发表于 2008-12-27 13:25:42 | 显示全部楼层 |阅读模式
    “小满字典”词库资源(以下简称“词典”)要靠使用者共同开发制作才能不断地丰富,同时,制作适合每个用户自己的“词典”也才能让“小满字典”的功用发挥到极致。故此,我不揣浅陋,把自己制作“词典”的一些粗浅经验总结成这篇“‘小满字典’词库制作初级教程”。希望能给初步接触“小满字典”的朋友们,特别是那些刚刚萌生制作“词典”想法而又没有更多计算机语言知识的业余爱好者一些帮助。
& l8 ^+ M, w* n& }  i3 i$ D
    一定格式的TXTEXCELACCESS文件都能通过词库转换软件“makexmdict.exe”转换为小满字典词库。下面以绝大多数坛友十分熟悉的TXT(记事本)和Excel文件转换“小满字典”词库为例:
    1. 准备各种适合做“词典”的TXT和Excel文件。2 j8 |1 a6 F- Q6 @; o
    其他格式的文本文件(如DOCPDF等)也可以把内容复制粘贴到TXT文件中。

6 p& f0 ~$ C( R8 D2 R2 J       2. 本“初级教程”所需软件:: _* P$ r0 `; C6 t
       2.1. “小满字典”制作工具makexmdict.exe(下载地址是http://www.luan8.com/makexmdict.rar【必备】
3 m; k6 a) h0 t       2.2. 电脑系统自带的(程序-附件-)“记事本”程序和MS Office Excel【必备】
3 K2 l7 Y5 m  B9 J% E# c       2.3. MS Office Word、UltraEdit-32等文本编辑软件【可选】

# @$ w7 _8 g" R2 N3 M" K       3. 词库制作过程:
    3.1. 以“搞笑翻译.txt”转换为“搞笑翻译”小满词库为例,说明TXT文件的转换。
   
% L- @( U7 k& F
    关键问题是让TXT文档的格式符合“小满字典”制作要求。
    “小满字典”格式上要求以“</>”分隔词条,以“<br>”标示换行,用“<hr>”划分隔线,并接受HTML语言中字体颜色、大小等的设置。
       3.1.1. 编辑TXT文件搞笑翻译.txt”,使其格式适合转换要求:
8 H- }3 E* }* A# G
       UltraEdit-32打开,或者把TXT文档中的内容复制到一个新建的MS Office Word文档(DOC文件)【以此为例】。* u4 z; r, D$ z0 J! H* u

" ]. J0 l! G; s. o. t2 ?& @2 X' d- d
       寻找文档格式方面的规律性(不同文档规律性是不同的)。“编辑”“替换”两个连续的段落标识^p^p^p</>^p,或者替换^p“</>^p“

) e! w" N  u1 r1 |3 T8 m

+ j  v3 x7 t- r/ n+ m8 A$ C
       “替换”的结果就划分了词条,或者说给文档做了词条划分标识。如下图所示:
& f& u/ p' b2 P
       再替换^p<br>^p,来实现词条内的换行。词条内第一个<br>前的内容就是词条的“标题”(单词),第一个<br>后的内容就是词条的“内容”(解释)。如下图所示

& \; U8 v/ G! C- D& |

3 B, F7 H" K5 h% E       当然,我们也完全可以再“替换”“ <br>^p</><br>”为“^p</>”,并直接删除最后一个没用的<br>,以使文本更精简。但在精简化之前的文件格式上已经符合转换的要求了。2 l- H- D! ^0 e
# D) J6 K# ^; I- J$ T) k. i
       接下来我们就可以Ctrl+A全选,Ctrl+C复制,然后以复制的内容替换“搞笑翻译.txt”的原内容,或者Ctrl+V粘贴内容到新建TXT文件中并保存,从而得到适用于转换词典的TXT文件。
' ^0 O& r2 q4 W9 v4 z5 i$ R4 h, i* \( n' Z+ d
       3.1.2. 转换格式合适的TXT文件为“词典”( Q9 ?$ f1 M0 ^2 ?9 G$ s) f

' H& d5 F; d5 j* @  P3 c       用“小满字典”制作工具makexmdict.exe,“选择文件”打开我们刚才编辑好格式的“搞笑翻译.txt”,进行“属性设定”后就可以点击“创建”来生成“词典”了。
2 m3 N0 A% S9 Y2 h/ x8 ~6 G
6 R1 h. g5 `4 a) S- Q" z" O# z0 `) n8 [$ `6 }3 I$ Y9 q" c2 x0 `

( q" ^  d2 Q. e7 s, i       我们制作出的“词典”现在是这个样子(如下图所示)的:- O! A2 Y+ I% {
: O/ w9 S$ L8 O; T( X: \+ l# y

! v8 A# C* V5 ~6 D7 I       这已经可以用了。但如果你觉得词条“标题”(单词)和“内容”(解释)都用默认的颜色不够理想。你还可以设定颜色。
* T/ h: n" c9 j9 h; \; _6 B; b5 y6 V( @. B: x% X1 O
     3.1.3. 设定“词典”中“词条”(单词)和“内容”(解释)的颜色。* ^  c; v( V. E5 T

3 a3 j* a3 k  _; j1 g4 Y2 f
       3.1.3.1. “词典”颜色设置最简方式(软件作者dreamtotrue提供)是双击进入已生成的词库文件夹,比如我们刚做好的“词典”“搞笑翻译”文件夹,然后用“记事本”或“UltraEdit-32”等软件打开config.xml”这个文件,找到下图的位置。" @9 h/ o7 T. F7 Q1 |5 K+ j

" `: T/ E, X, j1 L8 }! ~$ K
# S8 W0 i+ A+ h% R+ ^* k6 p9 Q- Z
" S  l; c' L& r( c6 s: D
       通过更改xhytitle”的“color”和“xhycontent”的“color代码就可以设置字体颜色了。比如把“xhytitle”“color”中的“#0066CC”替换为“#FF0000”就可以使“标题”(单词)以红色显示,替换xhycontent”“color' _) B1 n3 K$ ?& e" G) m; B- \
中的“#0066CC为“#009100”就可以使“内容”(解释)以绿色显示了。/ V3 {' g8 W7 e5 V! [1 |$ W
       编辑字体颜色并保存后的显示效果如下图所示:: S. s# ?$ G. [& ~1 n  d

; f0 \( ]; `  h
, @  q! P+ }8 {: b
    具体其他颜色代码请参考附件一“颜色代码表”。

" y" l" m" d  o1 q3 J+ u& Q7 t5 ]- \       3.1.3.2. 分别设置词条内容中不同部分颜色的方法:+ S9 O% j. F  F0 E5 x1 Y; G
       比如我们有一个TXT名为“翻译.txt”,我们可以如下来设置字体颜色:
( R4 h8 e: b# l1 k3 K- u& t
5 l. Z2 i/ J( a& x
       其中<font color=“#EA0000”>表示其后文字直到</font>截止的颜色为代码#EA0000所代表的颜色。
/ ]5 i* f. J% a0 E       用这个带有颜色设置的“翻译.txt”转换成的词典内容颜色就是多样的了。5 n, N8 R, f% d7 d* a8 S8 C
0 W/ q5 b$ ^& p+ L
       当然,如果要使PPC上也显示出自己设定的颜色,有时需要把下面一段代码(为醒目我标注为红色)

1 p% }. |0 c8 _7 s<if $var.TitleColor!=''>  x, Q" J1 O5 T+ Z" S: x; A
<font color="[$var.TitleColor]">[$var.Title]</font>
% m9 g- Y$ x# r: H: s4 u$ y; |<else>( }/ \1 y0 n+ W. _2 e/ S
[$var.Title]
/ E! s8 [# B( X& T
- c9 m4 e: j$ K0 e2 O+ M4 l3 ]4 W</if>
" O# U) F0 k, u1 Z% D$ P# G* n. Y
       复制上述(红色)代码并粘贴到字典文件——即“翻译”文件夹config.xml文件内“xhytitle”和“xhycontent”的“color”设置之前并保存。最后,看看下面的PPC显示效果图吧!

. H1 K* r4 u6 c! w# T7 z4 r/ \9 e9 [+ C% `* ~- W8 [) U5 j7 o+ R/ y
       3.2. 转换Excel文件为“小满字典”词库的方法(以多字段的藏书目录为例):
        3.2.1. 准备好要转换的Excel文件。
        主要是去掉冗余的行与列,并注意数据所在的sheet名称,也可自己改一下sheet名称。

+ ]- k) ?3 g) {

* S8 ]* Q, N4 X& C: V0 K
        3.2.2. 打开小满词库制作工具(MakeXMDict.exe)并选择数据源。
        数据来源选择“Excel文件”。然后,通过“选择文件”找到要转换文件并“打开”。接着选定数据所在的sheet。
6 u6 f( |3 H3 Q2 T+ O
; m+ u" ?! N% j% F+ q# z5 T2 C
       3.2.3. 然后就可以具体改动“系统”和“字段属性”中的具体设置,使之符合自己的要求。
       设置后,点击“创建”按钮就可以自动生成词库文件了。所需时间依数据量而有所不同,小的词库文件制作一般只需要几秒钟即可完成。

; i. u4 |. p2 c9 a% |* Z+ k

+ y( ]3 |1 }6 {. z1 I7 k
        3.2.4. “词库文件”显示效果的优化。
       “创建”后的“词库文件”已经可以使用了。但如果想要使各字段内容以不同颜色醒目显示,则需要用记事本或UE打开config.xml文件,在下图所示的位置进行编辑,增加高亮部分所示的字体颜色代码并保存。
* ~; M" X$ d* Q

% T! F2 ]- q* i$ p
       3.2.5. 现在,制作已经完成了。可以点击“词库”左侧的某个字段,然后进行相应的快速搜索。
# s; I4 ?: e: C! N! ^# t# v
8 \9 ?, c: Y6 v1 H- }
       3.2.6. 搜索结果如下

9 d5 [; N2 N3 ~
* u* x1 g' H  V
       制作这类数据词库是不是很容易?!我相信,初次接触“小满字典”的朋友也能够较轻松地制作出自己的“小满字典”词库文件。欢迎大家共享可以公开的“小满字典”资源!
-------------------------------------------------------------------------------------------------------------------------------------
2009年3月28日增加了Excel制作“小满字典”词库的内容,并对全文标题等做统一调整。
. _" {+ _' |0 ?- X
( C9 i. P6 r7 j' l6 R( I
[ 本帖最后由 philostone 于 2009-3-28 11:24 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

评分

1

查看全部评分

该用户从未签到

发表于 2008-12-27 18:11:38 | 显示全部楼层
好东东:loveliness:
  • TA的每日心情
    开心
    2018-7-19 02:16
  • 签到天数: 20 天

    [LV.4]偶尔看看III

    发表于 2008-12-27 23:54:36 | 显示全部楼层
    老虎不发喵,你当我是病危啊。。:lol 0 C. B& L- I- V* v4 j+ X
    话说这种格式的小满字典和mdict 的html格式一样。

    该用户从未签到

    发表于 2009-2-23 18:25:06 | 显示全部楼层
    下載學習,  ?2 U( ], `7 m, `) |
    謝謝!!
  • TA的每日心情

    2021-9-13 00:01
  • 签到天数: 268 天

    [LV.8]以坛为家I

    发表于 2009-2-27 10:17:38 | 显示全部楼层
    在vga上显示字体太小了,请问如何改大点呢?

    该用户从未签到

     楼主| 发表于 2009-2-27 12:28:56 | 显示全部楼层

    回复 5楼 dragonyuan 的帖子

    可以通过修改“config.xml”文件来更改“小满字典”词库显示时的文字大小、颜色等!下面红色字体部分是我加进《康熙字典》的“config.xml”文件相应位置的字体设置项,其中“size=6”和“size=7”就是设定字体大小的,“color="#CE0000"”是设定字体颜色的。如果想让字段名称(比如“字典字头”字段)也和其后的文字同样大小和颜色,只要把<font size=7 color="#CE0000">放在它前面即可。2 _5 T' a8 V" B" p
    下面“【”与“】”之间的内容是从修改后的“小满字典”版《康熙字典》的“config.xml”文件(见)相应位置复制过来的,效果如附图所示。
    2 {7 ~2 y9 \9 u( {5 T: h# r, B【 <rhtml><![CDATA[<span class='no'><%=num%>:</span>, {9 g( S$ v/ i4 E5 D
    <span class='xhytitle'>汉字字头:<font size=6 color="#6F00D2"><%=5A418E6BBF3C4EDC1AE9D7C24661ABAF%></font></span> <br />) i- m$ b  L" q. Y* s
    <span class='xhycontent'>所属集部:<font color="#007979"><%=137834425E8D1ED4D25A675184B98F80%></font></span> <br />5 }. `6 N) ?; {
    <span class='xhycontent'>字典字头:<font size=7 color="#CE0000"><%=137834425E8D1ED4670F24E3C72A9845%> </font></span> <br />' n% A4 s* D9 u6 R: Q# h5 [
    <span class='xhycontent'>字典内容:<font color="#004B97"><%=137834425E8D1ED4A1D23B1A641BC486%></font></span><hr /> ]]></rhtml>
    * O" |, \5 D6 E, C  <rstyle><![CDATA[ 】
    2 P# U! [  l5 k# t至于“color=”后面的颜色代码表示什么颜色,请参看1楼附件中的“颜色代码表”!) `6 J- V: @; V! w8 t
    . ]* L8 ]# F7 h8 q) D
    [ 本帖最后由 philostone 于 2009-2-27 12:45 编辑 ]

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2009-3-21 22:54:39 | 显示全部楼层
    好教程!学习了!

    该用户从未签到

    发表于 2009-7-8 17:12:46 | 显示全部楼层
    顶嗲再看

    该用户从未签到

    发表于 2009-7-9 10:09:33 | 显示全部楼层
    博学,除了MDICT,此“小满”亦应好好学之

    该用户从未签到

    发表于 2009-8-6 23:49:16 | 显示全部楼层
    小满字典字典支持多大的词典??这么好的工具才是索引百度百科的最佳伴侣嘛...6 X5 a* M. K0 `: o# ?8 S' a+ n7 J
    行的话我来搞搞~~:P

    该用户从未签到

    发表于 2009-8-22 01:39:34 | 显示全部楼层
    先顶下版主先,谢谢版主无私的奉献,使我们又学到了东西。

    该用户从未签到

    发表于 2010-6-28 18:41:34 | 显示全部楼层
    bu cuo o hehehe

    该用户从未签到

    发表于 2010-10-31 20:16:28 | 显示全部楼层
    <span class='no'><%=num%>:</span><span class='hztitle'><%=name%></span> <br/>繁体 <font color='red'><%=oldname%></font>
    0 P1 |- X/ ]. S        <br /> 笔画 <font color='red'><%=strokes%></font> , 部首 <font color='red'><%=part%></font>,部首笔画  <font color='red'><%=partstrokes%></font>. p2 r7 w2 v; P( ~2 R" q
            <br /> 拼音 <span class='cypy'><%=spell%></span> <br /> <%=content%><br /><hr />- e, J+ D) d' S% U" z' H+ }
    上面是汉字字典里头的。想把字体变小要如何操作啊。改了<font color='red'><%=strokes%></font>这行反而变得程序不能用了,请lz指导一下啊。

    该用户从未签到

    发表于 2010-11-1 13:37:18 | 显示全部楼层
    还有个就是左边跟下边并没有见到拉条了。
    . o! B) H, N  h- h显示出一部分也不能用拉条移动

    该用户从未签到

    发表于 2011-6-23 13:16:13 | 显示全部楼层
    这么好的工具
  • TA的每日心情
    难过
    2020-2-27 01:04
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2011-10-4 22:01:43 | 显示全部楼层
    wm不根据屏的分辨率自动调整字体大小很麻烦啊。

    该用户从未签到

    发表于 2013-1-16 20:17:52 | 显示全部楼层
    感谢辛苦努力与无私奉献

    该用户从未签到

    发表于 2014-4-18 07:36:30 | 显示全部楼层
    不错不错,楼主是个绝对高手5 D7 q, H) X' J3 m
    , r) `- Z, F  v  e4 \
    2 L/ Q6 ~5 c% Q& Z! ~- T

    * z6 @( t0 t9 Y$ ~) ~# L* E  I
    6 u9 K6 Y, G4 c1 Y3 a* q  k, T  J9 v0 a% V( J7 |

    4 ]! H6 h$ S8 p( Q. u9 g2 g5 |! t/ I' C1 A  G/ k, Y* R
      T, B, B( u" x" W- J' r
    " S  }  X7 z# t1 e) z) w
    - K& j5 b4 O9 B* W

    4 C7 u  L" I* R/ u. z4 f
    / c5 `# B2 k4 [2 O/ L1 f{随机链接}{随机链接}{随机链接}{
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-3-29 00:48 , Processed in 0.055934 second(s), 17 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表