chigre 发表于 2012-11-4 19:51:07

制作MDX词典的简略经验

制作MDX词典经验①在线词典离线化:
1)\webdup 0.93 beta\下载在线词典;
2)用\TextForever\提取已下网页文件中特征行之间有效行;
3)使用\命令行CMD\合并所有文本文件;
4)使用\Notepad++\文本转码, 替代……等主要操作;
5)用\Excel 2010\导入数据,提取查询词条名后倒回④;
6)用\MdxBuilder\导出终文件
-------------------------------------------------------------------------
制作MDX词典经验②实体词典电子化:
1)\扫描仪\高清扫描, PS批量自动调整;
2)\ABBYY FineReader 11\OCR文本导出;
3)\Notepad++\加载文本自定义格式特殊显示一些成分,比如词性。屏幕左边放图片,右边文本编辑,人工校对;
4)\Excel 2010\特殊处理转回③……;
5)用\MdxBuilder\导出终文件
-------------------------------------------------------------------------
制作MDX词典经验③从其他词典格式转:
1)\词典格式转换软件\可以实现.DIC, .BGL, .LSD等转为.txt原文本...
2)\Notepad++、Excel等处理\…………略

海稻1414 发表于 2015-2-12 11:36:44

强烈要求补充:当编辑中文词典时,最好使用能自定义短语的输入法,比如搜狗!

当你不停地按住啊shift键输入xx》:”xx
你就知道按住shift键的手指是多么伤心

Hugh 发表于 2012-11-4 20:02:09

难得的技术贴!mark下!

chigre 发表于 2012-11-4 22:56:39

另外,把基本上常用的小工具软件放网盘共享了:
https://www.dropbox.com/sh/jkvmvgccfypyjla/FqHMEk9eOm

chigre 发表于 2012-11-5 00:57:29

2# heshunyihugh


只是很简略地列了下流程,实际处理你也知道很麻烦...
写个详细的教程很复杂。。。

Hugh 发表于 2012-11-5 11:38:20

感谢分享。

ROC腥猫 发表于 2012-11-5 12:57:53

谢谢分享 期待阁下大作!

chigre 发表于 2012-11-6 02:21:11

6# ROC腥猫


我做了一堆意大利语词典和西班牙语词典啦~

贵在坚持 发表于 2012-11-6 09:39:02

不错,希望能出个详细的教程,在写的对老鸟来说都已经明白,对菜鸟来说很难入门

倾情风 发表于 2013-1-4 13:39:30

支持,这是授人以渔啊!带动更大的群体来做这个事业

reynlee 发表于 2013-1-5 22:34:04

期待楼主能把金山词霸的柯林斯双解在线词典拉下来做成离线词典,那个词典太强大了

shenyan168 发表于 2013-1-6 19:25:51

还是希望有更广阔的MDX文件,有哪位高手能做一下最新版的药物手册吗?供那些学医的随身药物手册MDX。
在这先谢谢各位高手了但愿有人解决这个问题。

yesqincheng 发表于 2013-4-7 18:06:21

希望有更详细些的教程,最好带些个例子{:soso_e100:}

夕阳西夏 发表于 2013-4-12 19:39:46

楼主,你的小工具连接出错

supernj 发表于 2013-4-16 03:55:47

LZ您多次用到Excel,但是要知道即使最新版的Excel 2013 64-bit的版本中,每個單元格中最多有32767個字符。(Total number of characters that a cell can contain) http://office.microsoft.com/en-ca/redir/HA103980614.aspx?queryid=b9378707%2Dafb0%2D4a94%2Db77f%2Dea2e00a407a5&respos=2&CTT=1

可是比如LDOCE5中,很多詞條如back、think等等簡單的詞,代碼長度遠遠不止32767個字符,這種情況您用Excel怎麼處理?

xxfxx 发表于 2013-5-15 08:25:29

收藏。学习。

李响 发表于 2013-5-26 16:06:33

1# chigre
请问如何提取mdx合并版词典内的单个词典呢?

chigre 发表于 2013-5-26 17:33:37

16# 李响

GETDICT.EXE (2.6) 提取得到源txt文件,用excel等软件筛选相应的词条。
再制作。

李响 发表于 2013-5-27 10:33:37

17# chigre
原来这么复杂啊!所以得一条一条的筛选全部词条吗?

chigre 发表于 2013-5-27 16:50:38

18# 李响


当然不是,你放心,词典制作者绝对在词条分类上留下可以【筛选】的条件

游离状态 发表于 2013-5-29 00:33:51

真的好精简。。。。

李响 发表于 2013-5-31 11:22:30

19# chigre

明白了。我下次自己来试试。谢谢你!

chigre 发表于 2013-6-1 03:58:49

14# supernj

可以先把导出的MDX源txt 使用Ultraedit软件编辑,将部分HTML代码用(特殊的、不同的、唯一的)标志进行替代。
然后再使用excel处理,公式判断下是否还存在大于那个数值的单元格。。。

RacherSasuke 发表于 2015-2-8 11:36:16

可以自己制作词典了!!!
但愿有更加详细的教程

LAUTAIKIT 发表于 2015-2-20 13:48:33

中流砥柱,非常感谢!
页: [1] 2
查看完整版本: 制作MDX词典的简略经验