philostone 发表于 2008-12-27 13:25:42

“小满字典”词库制作初级教程

    “小满字典”词库资源(以下简称“词典”)要靠使用者共同开发制作才能不断地丰富,同时,制作适合每个用户自己的“词典”也才能让“小满字典”的功用发挥到极致。故此,我不揣浅陋,把自己制作“词典”的一些粗浅经验总结成这篇“‘小满字典’词库制作初级教程”。希望能给初步接触“小满字典”的朋友们,特别是那些刚刚萌生制作“词典”想法而又没有更多计算机语言知识的业余爱好者一些帮助。
    一定格式的TXT、EXCEL和ACCESS文件都能通过词库转换软件“makexmdict.exe”转换为“小满字典”词库。下面以绝大多数坛友十分熟悉的TXT(记事本)和Excel文件转换“小满字典”词库为例:    1. 准备各种适合做“词典”的TXT和Excel文件。
    其他格式的文本文件(如DOC、PDF等)也可以把内容复制粘贴到TXT文件中。
       2. 本“初级教程”所需软件:
       2.1. “小满字典”制作工具makexmdict.exe(下载地址是http://www.luan8.com/makexmdict.rar)【必备】
       2.2. 电脑系统自带的(程序-附件-)“记事本”程序和MS Office Excel【必备】
       2.3. MS Office Word、UltraEdit-32等文本编辑软件【可选】
       3. 词库制作过程:    3.1. 以“搞笑翻译.txt”转换为“搞笑翻译”小满词库为例,说明TXT文件的转换。   
    关键问题是让TXT文档的格式符合“小满字典”制作要求。    “小满字典”格式上要求以“</>”分隔词条,以“<br>”标示换行,用“<hr>”划分隔线,并接受HTML语言中字体颜色、大小等的设置。       3.1.1. 编辑TXT文件“搞笑翻译.txt”,使其格式适合转换要求:
       用UltraEdit-32打开,或者把TXT文档中的内容复制到一个新建的MS Office Word文档(DOC文件)【以此为例】。

       寻找文档格式方面的规律性(不同文档规律性是不同的)。“编辑”“替换”两个连续的段落标识^p^p为^p</>^p,或者替换^p“为</>^p“。

       “替换”的结果就划分了词条,或者说给文档做了词条划分标识。如下图所示:
       再替换^p为<br>^p,来实现词条内的换行。词条内第一个<br>前的内容就是词条的“标题”(单词),第一个<br>后的内容就是词条的“内容”(解释)。如下图所示:

       当然,我们也完全可以再“替换”“ <br>^p</><br>”为“^p</>”,并直接删除最后一个没用的<br>,以使文本更精简。但在精简化之前的文件格式上已经符合转换的要求了。

       接下来我们就可以Ctrl+A全选,Ctrl+C复制,然后以复制的内容替换“搞笑翻译.txt”的原内容,或者Ctrl+V粘贴内容到新建TXT文件中并保存,从而得到适用于转换词典的TXT文件。

       3.1.2. 转换格式合适的TXT文件为“词典”

       用“小满字典”制作工具makexmdict.exe,“选择文件”打开我们刚才编辑好格式的“搞笑翻译.txt”,进行“属性设定”后就可以点击“创建”来生成“词典”了。



       我们制作出的“词典”现在是这个样子(如下图所示)的:


       这已经可以用了。但如果你觉得词条“标题”(单词)和“内容”(解释)都用默认的颜色不够理想。你还可以设定颜色。

   3.1.3. 设定“词典”中“词条”(单词)和“内容”(解释)的颜色。

       3.1.3.1. “词典”颜色设置最简方式(软件作者dreamtotrue提供)是双击进入已生成的词库文件夹,比如我们刚做好的“词典”“搞笑翻译”文件夹,然后用“记事本”或“UltraEdit-32”等软件打开“config.xml”这个文件,找到下图的位置。



       通过更改“xhytitle”的“color”和“xhycontent”的“color”代码就可以设置字体颜色了。比如把“xhytitle”“color”中的“#0066CC”替换为“#FF0000”就可以使“标题”(单词)以红色显示,替换“xhycontent”“color”
中的“#0066CC”为“#009100”就可以使“内容”(解释)以绿色显示了。
       编辑字体颜色并保存后的显示效果如下图所示:


    具体其他颜色代码请参考附件一“颜色代码表”。
       3.1.3.2. 分别设置词条内容中不同部分颜色的方法:
       比如我们有一个TXT名为“翻译.txt”,我们可以如下来设置字体颜色:

       其中<font color=“#EA0000”>表示其后文字直到</font>截止的颜色为代码#EA0000所代表的颜色。
       用这个带有颜色设置的“翻译.txt”转换成的词典内容颜色就是多样的了。

       当然,如果要使PPC上也显示出自己设定的颜色,有时需要把下面一段代码(为醒目我标注为红色)
<if $var.TitleColor!=''>
<font color="[$var.TitleColor]">[$var.Title]</font>
<else>
[$var.Title]

</if>
       复制上述(红色)代码并粘贴到字典文件——即“翻译”文件夹config.xml文件内“xhytitle”和“xhycontent”的“color”设置之前并保存。最后,看看下面的PPC显示效果图吧!

       3.2. 转换Excel文件为“小满字典”词库的方法(以多字段的藏书目录为例):      3.2.1. 准备好要转换的Excel文件。      主要是去掉冗余的行与列,并注意数据所在的sheet名称,也可自己改一下sheet名称。

      3.2.2. 打开小满词库制作工具(MakeXMDict.exe)并选择数据源。      数据来源选择“Excel文件”。然后,通过“选择文件”找到要转换文件并“打开”。接着选定数据所在的sheet。

       3.2.3. 然后就可以具体改动“系统”和“字段属性”中的具体设置,使之符合自己的要求。       设置后,点击“创建”按钮就可以自动生成词库文件了。所需时间依数据量而有所不同,小的词库文件制作一般只需要几秒钟即可完成。

      3.2.4. “词库文件”显示效果的优化。       “创建”后的“词库文件”已经可以使用了。但如果想要使各字段内容以不同颜色醒目显示,则需要用记事本或UE打开config.xml文件,在下图所示的位置进行编辑,增加高亮部分所示的字体颜色代码并保存。

       3.2.5. 现在,制作已经完成了。可以点击“词库”左侧的某个字段,然后进行相应的快速搜索。

       3.2.6. 搜索结果如下:

       制作这类数据词库是不是很容易?!我相信,初次接触“小满字典”的朋友也能够较轻松地制作出自己的“小满字典”词库文件。欢迎大家共享可以公开的“小满字典”资源!-------------------------------------------------------------------------------------------------------------------------------------2009年3月28日增加了Excel制作“小满字典”词库的内容,并对全文标题等做统一调整。

[ 本帖最后由 philostone 于 2009-3-28 11:24 编辑 ]

zhu1234 发表于 2008-12-27 18:11:38

好东东:loveliness:

发哥 发表于 2008-12-27 23:54:36

老虎不发喵,你当我是病危啊。。:lol
话说这种格式的小满字典和mdict 的html格式一样。

Kan1 发表于 2009-2-23 18:25:06

下載學習,
謝謝!!

dragonyuan 发表于 2009-2-27 10:17:38

在vga上显示字体太小了,请问如何改大点呢?

philostone 发表于 2009-2-27 12:28:56

回复 5楼 dragonyuan 的帖子

可以通过修改“config.xml”文件来更改“小满字典”词库显示时的文字大小、颜色等!下面红色字体部分是我加进《康熙字典》的“config.xml”文件相应位置的字体设置项,其中“size=6”和“size=7”就是设定字体大小的,“color="#CE0000"”是设定字体颜色的。如果想让字段名称(比如“字典字头”字段)也和其后的文字同样大小和颜色,只要把<font size=7 color="#CE0000">放在它前面即可。
下面“【”与“】”之间的内容是从修改后的“小满字典”版《康熙字典》的“config.xml”文件(见)相应位置复制过来的,效果如附图所示。
【 <rhtml><![CDATA[<span class='no'><%=num%>:</span>
<span class='xhytitle'>汉字字头:<font size=6 color="#6F00D2"><%=5A418E6BBF3C4EDC1AE9D7C24661ABAF%></font></span> <br />
<span class='xhycontent'>所属集部:<font color="#007979"><%=137834425E8D1ED4D25A675184B98F80%></font></span> <br />
<span class='xhycontent'>字典字头:<font size=7 color="#CE0000"><%=137834425E8D1ED4670F24E3C72A9845%> </font></span> <br />
<span class='xhycontent'>字典内容:<font color="#004B97"><%=137834425E8D1ED4A1D23B1A641BC486%></font></span><hr /> ]]></rhtml>
<rstyle><![CDATA[ 】
至于“color=”后面的颜色代码表示什么颜色,请参看1楼附件中的“颜色代码表”!

[ 本帖最后由 philostone 于 2009-2-27 12:45 编辑 ]

老小林 发表于 2009-3-21 22:54:39

好教程!学习了!

3d11 发表于 2009-7-8 17:12:46

顶嗲再看

第3001人 发表于 2009-7-9 10:09:33

博学,除了MDICT,此“小满”亦应好好学之

a44091049 发表于 2009-8-6 23:49:16

小满字典字典支持多大的词典??这么好的工具才是索引百度百科的最佳伴侣嘛...
行的话我来搞搞~~:P

芸薇 发表于 2009-8-22 01:39:34

先顶下版主先,谢谢版主无私的奉献,使我们又学到了东西。

ccp 发表于 2010-6-28 18:41:34

bu cuo o hehehe

caiqp1974 发表于 2010-10-31 20:16:28

<span class='no'><%=num%>:</span><span class='hztitle'><%=name%></span> <br/>繁体 <font color='red'><%=oldname%></font>
        <br /> 笔画 <font color='red'><%=strokes%></font> , 部首 <font color='red'><%=part%></font>,部首笔画<font color='red'><%=partstrokes%></font>
        <br /> 拼音 <span class='cypy'><%=spell%></span> <br /> <%=content%><br /><hr />
上面是汉字字典里头的。想把字体变小要如何操作啊。改了<font color='red'><%=strokes%></font>这行反而变得程序不能用了,请lz指导一下啊。

caiqp1974 发表于 2010-11-1 13:37:18

还有个就是左边跟下边并没有见到拉条了。
显示出一部分也不能用拉条移动

xian595 发表于 2011-6-23 13:16:13

这么好的工具

xain 发表于 2011-10-4 22:01:43

wm不根据屏的分辨率自动调整字体大小很麻烦啊。

西风独自凉 发表于 2013-1-16 20:17:52

感谢辛苦努力与无私奉献

{部标焊管} 发表于 2014-4-18 07:36:30

不错不错,楼主是个绝对高手











static/image/common/sigline.gif
{随机链接}{随机链接}{随机链接}{
页: [1]
查看完整版本: “小满字典”词库制作初级教程