请问如何把一个mdx里面的词头提取出来?
各位好,第一次提问,要是问得太低级还请大家见谅啊。 打開goldendict,點擊詞典選項,點擊詞典選項,選中你要提取的字典,右鍵,詞典詞條,導出,完事 有python环境的话,试试 readmdict包安装
pip install readmdict
使用
from readmdict import MDX
filename = "some.mdx"
headwords = [*MDX(filename)]
print(headwods[:10])# fisrt 10 in bytes format
for hdw in headwods[:10]:
print(hdw.decode()) # fisrt 10 in string format
本帖最后由 喬治兄 于 2021-2-15 01:07 编辑
若是僅僅是詞頭,直接在 golden dictionary 匯出既可,此不需太複雜的操作 置顶帖:Dict Source Editor【2014.08.24】
https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=12972
(出处: 掌上百科 - PDAWIKI)
好的谢谢各位 在吗楼主,我有个想法,把不同版本词头提取出来,然后对比筛选,可以把新增加的词汇搞出来啊,哈哈,不知道我这个想法可不可行。。
页:
[1]