ok927 发表于 2014-7-12 07:56:22

请教:把mdict的源文件转成excel的方法

本帖最后由 ok927 于 2014-7-12 12:34 编辑

请教:把mdict的源文件转成excel,要求一个词条一行,词条、释义、分隔符</>各占一列,该怎么操作呢?
谢谢大家。

spoony1971 发表于 2014-7-12 13:15:22

恐怕很少有人会写代码转成微软的专用格式,实在想要的话就自己写个VB程序吧。

ryuya 发表于 2014-7-12 14:58:55

你能把文本整理到
headword\tcontent\t</>
headword\tcontent\t</>
headword\tcontent\t</>
.
.
.

就能直接貼到 Excel

不過 Excel 一個儲存格只能放三萬多個字元

ok927 发表于 2014-7-12 16:23:09

好的。谢谢您。

ok927 发表于 2014-7-13 11:30:45

把mdict的源文件转成excel,要求一个词条一行,词条、释义、分隔符</>各占一列,该怎么操作呢?

查\n</>\n
替\n

查^(?<sub>.*?)\n
替\1\t

查\n
替\t\n</>

lixun305 发表于 2014-8-2 09:09:54

</>也占一列有何意义? 例如:

week        <font color=red>week</font><br><font color=green>指的是一星期7天,每天24小时,一般表示提供不间断的服务也表示为7*24或7/24</font><br><font color=green></font><br><font color=green></font>

是要变成如下的xls格式吗:

col0         col1
week       指的是一星期7天,每天24小时,一般表示提供不间断的服务也表示为7*24或7/24

还是:

col0      
week      

col1
<font color=red>week</font><br><font color=green>指的是一星期7天,每天24小时,一般表示提供不间断的服务也表示为7*24或7/24</font><br><font color=green></font><br><font color=green></font>

lixun305 发表于 2014-8-2 09:10:39

本帖最后由 lixun305 于 2014-8-2 09:15 编辑

spoony1971 发表于 2014-7-12 13:15 static/image/common/back.gif
恐怕很少有人会写代码转成微软的专用格式,实在想要的话就自己写个VB程序吧。

确实编过,查找 mdb, xls, dict sqlite格式的词典文件。 可惜 mdx 文件格式不公开,goldendict的源码咱也看的头大,搞不定,所以只能支持getdict转换之后的 mdx 文本格式的文件,很别扭。
页: [1]
查看完整版本: 请教:把mdict的源文件转成excel的方法