spoony1971 发表于 2013-4-24 14:38:15

mdict mdx mdd 格式全公开,及开源代码

本帖最后由 spoony1971 于 2013-4-24 14:56 编辑

看到楼上提到goldendict支持mdict了,就去看了一下goldendict的源码,最终发现Xiaoqiang Wang对mdx,mdd格式的最终分析及开源python代码:
https://bitbucket.org/xwang/mdict-analysis
喜欢C++代码的可查看goldendict源码。(mdictparser.hh/.cc mdx.cc)
看来一直期待的开源mdx=>stardict转换程序也不远了。

一直以来寻求一款快速小巧可自由组合的字典工具,现在终于如愿以偿了。我用的是sdcv, vim命令行工具,可组合真人发音(sdcv, aplay功能),TTS组合音及全文朗读(mplayer功能),缩放功能(urxvt功能), 多TAB连环查询(vim功能),
并且基本上可以与所有应用程序相组合。实在是太完美了!

下次抽空上视频。

spoony1971 发表于 2013-4-24 14:47:54

本帖最后由 spoony1971 于 2013-4-24 14:51 编辑

下面是我的简化版命令行shell script
$cat td
#!/bin/sh
sdcv $1 | w3m -T text/html

可运行于所有平台,linux, macos, windows 及平板手机平台(需安裝shell)。

chigre 发表于 2013-4-24 16:26:45

完全看不懂你说的。。。
我太菜鸟了。。。
不过你很开心就对了

spoony1971 发表于 2013-4-24 17:02:13

3# chigre

上面提到的urxvt是命令行终端,aplay, mplayer是声音播放工具,vim是编辑工具, sdcv是字典软件(相当于mdict)
w3m是浏览器。
把这些程序组合起来使用就变得功能非常强大,几乎没有限制。

Hugh 发表于 2013-4-24 19:40:58

要是楼主能开发一个MDD提取软件就好了

spoony1971 发表于 2013-4-24 20:58:49

5# heshunyihugh

网页 https://bitbucket.org/xwang/mdict-analysis
上面提供的工具就可以提取所有的mdx,mdd数据, 命令
$readmdict.py -x oald8.mdx
会提取oald8.txt及所有的图像,声音文件。

只是上面的方法恐怕会得到很多重复的相同文件,譬如很多汉字发音相同,声音文件应该只有一个,但用上面命令的话每个同音汉字会重复得到一个相同的声音文件。
理想的方法是将声音文件转成stardict字典文件(不是资源文件), 譬如sound.dict.dz, 发音就可通过命令 "sdcv word | aplay"完成。如果需要格式转换的话也可通过makedict来做了。

chigre 发表于 2013-4-25 00:22:18

linux不懂哈哈

spoony1971 发表于 2013-4-25 01:04:22

7# chigre

所有上面提到的工具都是跨平台的,不仅可以在linux,苹果机上用,微软的平台上一样没问题。 平板手机上要先装个shell.

chigre 发表于 2013-4-25 01:07:00

8# spoony1971


尽管如此,我还是没有入门,用着Goldendict就很好了。

louislaolu 发表于 2013-4-25 15:17:54

太高深了,连围观的基础都没有!

Hugh 发表于 2013-4-28 10:13:45

5# heshunyihugh

网页 https://bitbucket.org/xwang/mdict-analysis
上面提供的工具就可以提取所有的mdx,mdd数据, 命令
$readmdict.py -x oald8.mdx
会提取oald8.txt及所有的图像,声音文件。

只是上面的 ...
spoony1971 发表于 2013-4-24 20:58 https://pdawiki.com/forum/images/common/back.gif
chigre刚教了我更傻瓜的办法!

vinnie 发表于 2013-5-19 11:58:42

windows上怎么用?

vinnie 发表于 2013-5-19 12:03:14

楼主是写给大神看的。菜鸟也想学点用用,可惜连shell是什么都不知道。脚本怎么运行根本不知道。

tianxia1 发表于 2013-6-19 09:54:10

mark ,,yong deshang

tjzzw 发表于 2013-8-4 13:27:57

{:soso_e179:}向高手学习,但几乎没有基础,还请高手进一步详细解释或者干脆做个解压释放程序,期待中

tjzzw 发表于 2013-8-4 13:29:03

现在缺乏一个MDD加压释放程序。

yangxiups 发表于 2013-8-4 13:37:19

膜拜。

spoony1971 发表于 2013-8-4 20:39:39

现在缺乏一个MDD加压释放程序。
tjzzw 发表于 2013-8-4 13:29 https://pdawiki.com/forum/images/common/back.gif
readmdict.py 已经支持mdd转换。而且经测试解压后不会有重复文件出现。

tjzzw 发表于 2013-8-5 14:46:28

18# spoony1971

哪里下载readmdict.py,如何使用,shell哪里下载安装,我想学习一下,希望多指教!尽量详细说明一下,不胜感激。

tjzzw 发表于 2013-8-6 23:50:17


readmdict.py 已经支持mdd转换。而且经测试解压后不会有重复文件出现。
spoony1971 发表于 2013-8-4 20:39 https://pdawiki.com/forum/images/common/back.gif

老兄,我给您发了站内消息,恭候您的答复。

h11947634 发表于 2013-12-26 21:42:09

louislaolu 发表于 2013-4-25 15:17 static/image/common/back.gif
太高深了,连围观的基础都没有!

确实啊

h11947634 发表于 2013-12-26 21:43:06

louislaolu 发表于 2013-4-25 15:17 static/image/common/back.gif
太高深了,连围观的基础都没有!

确实啊

rongmu 发表于 2013-12-29 17:38:03

这个很有前途!
不过我发现目前 Goldendict 还不能正确显示 LDOCE4 等词典的音标
另外有没有办法让 Goldendict 使用 Mdict 的语音库?

风雪夜归人 发表于 2014-2-7 14:06:35

膜拜LZ~~实在看不懂~~

yaodis 发表于 2014-4-23 19:32:02

期待你的视频,有个截图也好
页: [1] 2
查看完整版本: mdict mdx mdd 格式全公开,及开源代码