wubis 发表于 2016-6-17 15:19:04

mdict源文件如何合并词条,有什么简单的方法吗

本帖最后由 wubis 于 2016-6-17 15:26 编辑

mdict源文件如何合并词条,有什么简单的方法吗,本人想用perl,是菜鸟菜鸟级
我指的是不同词典有同一词条入口不同词条内容,将不同内容合成到同一词条下面,不是词典源文件的叠加,之前看到有教程和软件的,现在找不到了

onlyXXenglish 发表于 2016-7-11 20:39:29

Slav 发表于 2016-7-11 20:03
Hello, my apologies can not read Chinese language clearly with a computer translation service. Have...

{:11_380:}

PurlingNayuki 发表于 2016-6-18 04:46:40

本帖最后由 PurlingNayuki 于 2016-6-18 05:23 编辑

給個思路:

[*]讀入詞條。按照 MDict 原始檔的格式,每次讀取一行。第一行:詞頭。接下來,循環讀入每行,直到讀入 '</>'。
[*]建立集合。集合是一對一的 mapping,即一個 key 對應一個 value,key 不得重複。利用這個特點,每次讀入一個詞條,則判斷集合中是否有該詞條,如果沒有,加入;如果已有,合併。在 Python 中可以利用 dict(字典)完成,Perl 不瞭解不好意思。
[*]排序輸出。排序也可以省略。

以上沒有任何最佳化,但是效率應該是堪用的。大部分程式語言都能輕松完成,Perl 應該是更精於此類應用。

sky66 发表于 2016-6-17 22:00:23

https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=12972

2. 文件的合并
可以把多个Mdx、MDict源文件合并到一起。当你同时打开了多个文件时,可以用两种方式把它们合并到一个文件中。有全部合并和补充合并供你选择。

Slav 发表于 2016-7-11 20:03:03

Hello, my apologies can not read Chinese language clearly with a computer translation service. Have the same idea to merge several dictionaries into a single one. But followed to the link provided in order to download Dict Source Editor and could not able to find the download link...Could anyone help me to download Dict Source Editor?

fnaviwwo1 发表于 2016-7-11 20:54:40

本帖最后由 fnaviwwo1 于 2016-7-11 21:02 编辑

我的那个简明牛津词典的帖子里有类似的ruby代码,我把两本词典的释义合并单一条目,用perl也差不多。
https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=17346
参考24行到29行就可以了。
其实不合并直接保留多个条目在goldendict下是能正常显示的,不过欧陆不能同时识别@@@link ,也不能保证有序。

kyletruman 发表于 2016-10-25 11:10:36

本帖最后由 kyletruman 于 2016-10-25 15:07 编辑

感谢大家分享合并词条的经验!受教了。
By the way, 楼主您今天分享的perl词典的mdx很不错,谢谢!

chinakid1 发表于 2016-11-22 23:20:08

搜索:Mdict词典DIY工具系列

mingqing007 发表于 2017-1-13 01:37:24

onlyXXenglish 发表于 2016-7-11 20:39


感谢分享~

Okya 发表于 2019-9-24 19:24:18

页: [1]
查看完整版本: mdict源文件如何合并词条,有什么简单的方法吗