lemonlab 发表于 2020-1-28 00:21:46

mdx转txt文本源码的四种方法

本帖最后由 lemonlab 于 2020-1-28 03:46 编辑

一、[MdxExport3.5-MDX与MDD资源导出小工具。](https://www.pdawiki.com/forum/thread-17709-1-1.html)
    知道的人最多的老牌工具啦,据说是GetDict2_6的升级版

二、[ PatchO8C repacked - Extract MDX/MDD ](https://www.pdawiki.com/forum/fo ... 8848&extra=page%3D1)
3. 以 BIG5 编码时,最好手动选 CP950 或是香港的 BIG5HKSCS。用 Python 的 BIG5 会少几个字,例如你说的「裏」。当字典編码是 BIG5 时,可以两种解码 CP950 或 BIG5HKSCS 都试试看,这些当年都统称 BIG5,结果会不太一样。
4. 新增 Decoding error 的处理方式。 之前 Crash 或转不出来都是解码的问题,有些是 Python 的限制。
    a. Ignore: 直接把解不出来的字删除。
    b. Replace: 把解不出来的字以�替换。所以解出来後要注意查找这个字,再和原版比较校对。
    c. Strict: 这就是之前的模式。一报错,马上就停止执行

1.0.9 2016.11.29 unescape
按单词表包含或排除提取到粘贴板
note:
hit ESC 3 times 按{Esc}三次有扩展功能,加载单词表,按Open打开txt,csv逗号分隔文件
all: paste from csv: (^[^\n]+)\n(.+)\n(</>)$,,\1\2\3
key: paste from csv: (^[^\n]+)\n(.+)\n(</>)$,,\1      提取词头
definition: paste from csv: (^[^\n]+)\n(.+)\n(</>)$,,\2    仅仅提取定义

三、pyglossary(https://www.pdawiki.com/forum/fo ... &tid=37718&ctid=514)
    全能手,能在多种词典源文件格式之间转换,很强大,不过要安装python3,
    有窗口界面,运行 run-Tkinter-based interface.bat
四、(https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=12972&page=1&extra=#pid178848)
Export-Custom可以按照自己的需求导出指定的词条文本。例如只导出自己需要的某些词条,或者不导出某些词条。只需将你需要导出的词条保存到一个文本文件,每个词条一行,然后指定这个文件即可。

(https://www.pdawiki.com/forum/thread-33808-1-1.html)
    个人测试用不起来,命令行提示找不到模块

另外还有几个用python来读取mdx的,玩anki的时候经常遇到
1,mdict_reader
2,mdx-server
3,flask-mdict

在转出txt源文件后,Mdict Editor Tool v2.0.35-- 多功能个性化词典制作工具
这工具按自定义单词表提取很好使

(https://bitbucket.org/xwang/mdict-analysis/src/default/)如果谈到最有贡献达到当然是mdict的作者R大,和goldendict的俄罗斯大侠
除此之外还有一位也是不能被忘记的就是 (https://bitbucket.org/xwang/mdict-analysis/src/default/)
mdx格式的解密者,如果没有解密,mdx无法被更多词典壳体支持,金鱼和欧路估计也难有今天的影响力
印证了一个规律,一个有影响力的工具必须得和chrome,python沾点边

最后一并感谢所有这些默默奉献的大神


920132111 发表于 2020-1-28 13:07:54

谢谢楼主分享精品文章

ma_rui888 发表于 2023-2-16 01:17:45

Mdict Editor Tool 可以将txt转为mdx, 我得学学
页: [1]
查看完整版本: mdx转txt文本源码的四种方法