mdx 抽取和剔除工具
本帖最后由 lbhl 于 2019-12-16 21:44 编辑什么工具可以:
(1)将a.mdx中含有的b.mdx中的词条抽取出来后生成新的c.mdx
(2)将a.mdx中含有的b.mdx中的词条剔除后的剩余部分生成新的c.mdx
(3)假设b.txt是一个纯文本文件,每行是一个单词,无任何义项和解释例句等。将a.mdx中含有的b.txt中的词条抽取出来后生成新的c.mdx
(4)将a.mdx中含有的b.txt中的词条剔除后的剩余部分生成新的c.mdx
(5)将a.mdx 和 b.mdx 合并成一个c.mdx,a.mdx 和 b.mdx共有的单词内容叠加且只占一个词条
看这个:https://www.pdawiki.com/forum/thread-23986-1-1.html 所以,要懂得正则表达式。不然,求助吧。 强强强强强强强强强强强强强强强强强强强强强强请问 如果不想学python,perl编程的话;提供一个思路,用EmEditor+Excel。 该板块置顶帖子Dict Source Editor就可以做到。
(1)获取b.mdx词表,提取a.mdx里的条目。
(2)也是获取b.mdx的词表,去除a.mdx里b.mdx里的所有条目。
(3)和(4)和(1)、(3)一样,Dict Source Editor同时支持mdx和mdx的txt源文件。
Dict Source Editor也支持合并词条,当然是在同一个条目下两个body内容。 利用 Python 的 readmdict 包可能三五十行左右码的样子吧
页:
[1]