lbhl 发表于 2019-12-16 21:41:39

mdx 抽取和剔除工具

本帖最后由 lbhl 于 2019-12-16 21:44 编辑

什么工具可以:
(1)将a.mdx中含有的b.mdx中的词条抽取出来后生成新的c.mdx
(2)将a.mdx中含有的b.mdx中的词条剔除后的剩余部分生成新的c.mdx
(3)假设b.txt是一个纯文本文件,每行是一个单词,无任何义项和解释例句等。将a.mdx中含有的b.txt中的词条抽取出来后生成新的c.mdx
(4)将a.mdx中含有的b.txt中的词条剔除后的剩余部分生成新的c.mdx
(5)将a.mdx 和 b.mdx 合并成一个c.mdx,a.mdx 和 b.mdx共有的单词内容叠加且只占一个词条

klwo2 发表于 2019-12-16 22:41:54

看这个:https://www.pdawiki.com/forum/thread-23986-1-1.html

leescott 发表于 2019-12-17 08:43:05

所以,要懂得正则表达式。不然,求助吧。

zyc0219 发表于 2019-12-17 10:51:31

强强强强强强强强强强强强强强强强强强强强强强请问

lgmcw 发表于 2019-12-17 20:45:27

如果不想学python,perl编程的话;提供一个思路,用EmEditor+Excel。

流星冲击 发表于 2019-12-25 22:41:07

该板块置顶帖子Dict Source Editor就可以做到。
(1)获取b.mdx词表,提取a.mdx里的条目。
(2)也是获取b.mdx的词表,去除a.mdx里b.mdx里的所有条目。
(3)和(4)和(1)、(3)一样,Dict Source Editor同时支持mdx和mdx的txt源文件。
Dict Source Editor也支持合并词条,当然是在同一个条目下两个body内容。

mikeee 发表于 2019-12-27 18:14:32

利用 Python 的 readmdict 包可能三五十行左右码的样子吧
页: [1]
查看完整版本: mdx 抽取和剔除工具