Anonymous 发表于 2021-3-24 20:22:56

有谁能帮忙写一个制作反查mdx的教程呢?

MDict 词库资源区 基本上没有几个反查mdx的公开分享,反查mdx基本上全部跑到 资源自助服务区 了,授人以鱼不如授人以渔,希望有人能够帮忙写一个教程,让更多的人掌握制作反查mdx的方法,不胜感激!

言叶之庭 发表于 2021-3-24 21:02:38

其它网站上有人教过,咱智商有限学不会。

Anonymous 发表于 2021-3-24 22:20:23

言叶之庭 发表于 2021-3-24 21:02
其它网站上有人教过,咱智商有限学不会。

哪个网站?我网上搜遍了都没有找到介绍如何制作反查mdx的教程{:4_100:}

言叶之庭 发表于 2021-3-24 22:57:11

本帖最后由 言叶之庭 于 2021-3-25 13:22 编辑

匿名者 发表于 2021-3-24 22:20
哪个网站?我网上搜遍了都没有找到介绍如何制作反查mdx的教程

你不在其它网站?没写教程,只是用ZOOM直播教过。制作词典,爬取词典网站数据,英译匹配中译,提取词组,反查词典等等这些都授过课,可以看代码自行研究。反查词典也就那样吧,最好是能够全文搜索。

大橙子 发表于 2021-3-25 08:45:23

本站很多都是收费的,别的网站有分享“免费 mdict”的,你搜搜看

starmars 发表于 2021-3-25 10:52:54

本帖最后由 starmars 于 2021-3-25 10:57 编辑

反查词典制作的一个关键点在于需要通过某特定标签内容和其他某标签内容进行比对,而每一部MDX词库的HTML的标签结构都不相同,不可能有通用的方法。

不通过编程,仅仅通过在文本编辑器中进行正则替换处理来完成难度是非常大的。而绝大部分人都不是程序员,所以,期待有给非专业人员看的通用的制作教程发布可能您只有失望了。

而从专业角度上说,反查MDX制作技术和任何其他MDX制作一样,没有什么技术含量。只要你会编程,无论python还是java,c#,会一点该语言基本的正则库API调用,会集合类库中的常见数据结构,则非常简单,基本上无需他人发布什么教程,只要愿意花时间,我相信任何专业人员都能轻易做出来。

玩MDX,如果正则表达式水平不够精通,写不出复杂的满足自己需求的正则表达式,则也可以简单地利用编程来弥补。并非精通的正则表达式水平加上一般的入门编程水平,可以基本满足任何MDX制作的要求。

wjl 发表于 2021-3-25 12:49:58

不上这个网站之前,从来没听说过反查词典,说实话正查词典下载后使用频率都很低,反查感觉也不是必不可少的那种

Anonymous 发表于 2021-3-25 14:41:05

wjl 发表于 2021-3-25 12:49
不上这个网站之前,从来没听说过反查词典,说实话正查词典下载后使用频率都很低,反查感觉也不是必不可少的 ...

英汉mdx词典或者英英mdx词典,需要把每个单词里面的词组短语单独提取出来,才能提高该mdx词典的使用频率

VimVim 发表于 2021-3-27 05:40:12

1、分析现有词典的源文件结构,使用 Python 的 BS 等 Library 分别提取出释义、例句等你希望进行反查的内容。
2、使用Python的分词器jieba等,将第1步的释义、例句的主要词条提取出来,即形成反查词典的词头。
3、使用“倒排索引”的编程技巧,将提取出的词条与原始mdx的keyword对应起来,并存储为python的dict数据结构。
4、即将上述带有反查数据的 python dict 输出为 mdx 标准的源格式,完成。

starmars 发表于 2021-3-27 12:02:13

VimVim 发表于 2021-3-27 05:40
1、分析现有词典的源文件结构,使用 Python 的 BS 等 Library 分别提取出释义、例句等你希望进行反查的内容 ...

Python 的 BS 等 Library 分别提取出释义、例句。Python的分词器jieba。—— 这一切看起来非常好哪。可能Python编程比其他语言制作MDX更方便点,因为有强大的库可用。
页: [1]
查看完整版本: 有谁能帮忙写一个制作反查mdx的教程呢?