Junming 发表于 2021-2-14 22:23:00

请问如何把一个mdx里面的词头提取出来?

各位好,第一次提问,要是问得太低级还请大家见谅啊。

cja1994 发表于 2021-2-16 11:05:26

打開goldendict,點擊詞典選項,點擊詞典選項,選中你要提取的字典,右鍵,詞典詞條,導出,完事

mikeee 发表于 2021-2-15 16:15:20

有python环境的话,试试 readmdict包

安装
pip install readmdict

使用
from readmdict import MDX

filename = "some.mdx"
headwords = [*MDX(filename)]
print(headwods[:10])# fisrt 10 in bytes format
for hdw in headwods[:10]:
        print(hdw.decode())   # fisrt 10 in string format

喬治兄 发表于 2021-2-15 01:05:44

本帖最后由 喬治兄 于 2021-2-15 01:07 编辑

若是僅僅是詞頭,直接在 golden dictionary 匯出既可,此不需太複雜的操作

kyletruman 发表于 2021-2-15 00:44:56

置顶帖:Dict Source Editor【2014.08.24】
https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=12972
(出处: 掌上百科 - PDAWIKI)

Junming 发表于 2021-2-16 12:16:14

好的谢谢各位

enihs情深 发表于 2022-8-3 16:01:27

在吗楼主,我有个想法,把不同版本词头提取出来,然后对比筛选,可以把新增加的词汇搞出来啊,哈哈,不知道我这个想法可不可行。。
页: [1]
查看完整版本: 请问如何把一个mdx里面的词头提取出来?