mdict mdx mdd 格式全公开,及开源代码
本帖最后由 spoony1971 于 2013-4-24 14:56 编辑看到楼上提到goldendict支持mdict了,就去看了一下goldendict的源码,最终发现Xiaoqiang Wang对mdx,mdd格式的最终分析及开源python代码:
https://bitbucket.org/xwang/mdict-analysis
喜欢C++代码的可查看goldendict源码。(mdictparser.hh/.cc mdx.cc)
看来一直期待的开源mdx=>stardict转换程序也不远了。
一直以来寻求一款快速小巧可自由组合的字典工具,现在终于如愿以偿了。我用的是sdcv, vim命令行工具,可组合真人发音(sdcv, aplay功能),TTS组合音及全文朗读(mplayer功能),缩放功能(urxvt功能), 多TAB连环查询(vim功能),
并且基本上可以与所有应用程序相组合。实在是太完美了!
下次抽空上视频。 本帖最后由 spoony1971 于 2013-4-24 14:51 编辑
下面是我的简化版命令行shell script
$cat td
#!/bin/sh
sdcv $1 | w3m -T text/html
可运行于所有平台,linux, macos, windows 及平板手机平台(需安裝shell)。 完全看不懂你说的。。。
我太菜鸟了。。。
不过你很开心就对了 3# chigre
上面提到的urxvt是命令行终端,aplay, mplayer是声音播放工具,vim是编辑工具, sdcv是字典软件(相当于mdict)
w3m是浏览器。
把这些程序组合起来使用就变得功能非常强大,几乎没有限制。 要是楼主能开发一个MDD提取软件就好了 5# heshunyihugh
网页 https://bitbucket.org/xwang/mdict-analysis
上面提供的工具就可以提取所有的mdx,mdd数据, 命令
$readmdict.py -x oald8.mdx
会提取oald8.txt及所有的图像,声音文件。
只是上面的方法恐怕会得到很多重复的相同文件,譬如很多汉字发音相同,声音文件应该只有一个,但用上面命令的话每个同音汉字会重复得到一个相同的声音文件。
理想的方法是将声音文件转成stardict字典文件(不是资源文件), 譬如sound.dict.dz, 发音就可通过命令 "sdcv word | aplay"完成。如果需要格式转换的话也可通过makedict来做了。 linux不懂哈哈 7# chigre
所有上面提到的工具都是跨平台的,不仅可以在linux,苹果机上用,微软的平台上一样没问题。 平板手机上要先装个shell. 8# spoony1971
尽管如此,我还是没有入门,用着Goldendict就很好了。 太高深了,连围观的基础都没有! 5# heshunyihugh
网页 https://bitbucket.org/xwang/mdict-analysis
上面提供的工具就可以提取所有的mdx,mdd数据, 命令
$readmdict.py -x oald8.mdx
会提取oald8.txt及所有的图像,声音文件。
只是上面的 ...
spoony1971 发表于 2013-4-24 20:58 https://pdawiki.com/forum/images/common/back.gif
chigre刚教了我更傻瓜的办法! windows上怎么用? 楼主是写给大神看的。菜鸟也想学点用用,可惜连shell是什么都不知道。脚本怎么运行根本不知道。 mark ,,yong deshang {:soso_e179:}向高手学习,但几乎没有基础,还请高手进一步详细解释或者干脆做个解压释放程序,期待中 现在缺乏一个MDD加压释放程序。 膜拜。 现在缺乏一个MDD加压释放程序。
tjzzw 发表于 2013-8-4 13:29 https://pdawiki.com/forum/images/common/back.gif
readmdict.py 已经支持mdd转换。而且经测试解压后不会有重复文件出现。 18# spoony1971
哪里下载readmdict.py,如何使用,shell哪里下载安装,我想学习一下,希望多指教!尽量详细说明一下,不胜感激。
readmdict.py 已经支持mdd转换。而且经测试解压后不会有重复文件出现。
spoony1971 发表于 2013-8-4 20:39 https://pdawiki.com/forum/images/common/back.gif
老兄,我给您发了站内消息,恭候您的答复。 louislaolu 发表于 2013-4-25 15:17 static/image/common/back.gif
太高深了,连围观的基础都没有!
确实啊 louislaolu 发表于 2013-4-25 15:17 static/image/common/back.gif
太高深了,连围观的基础都没有!
确实啊 这个很有前途!
不过我发现目前 Goldendict 还不能正确显示 LDOCE4 等词典的音标
另外有没有办法让 Goldendict 使用 Mdict 的语音库? 膜拜LZ~~实在看不懂~~ 期待你的视频,有个截图也好
页:
[1]
2