掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 2198|回复: 10

[求助] 请教下大神们mdx词典的数据结构是怎样的?想提取数据

[复制链接]

该用户从未签到

发表于 2013-5-13 10:53:31 | 显示全部楼层 |阅读模式
我想做个SuperMemo UX的背单词词库,但是释义比较难整,就想从mdx词典内提取数据。
, [# c1 _3 U" T# R3 jSM UX用的是xml语言的,之前用GetDict(2.3版)从mdx词典里提取出html的文本,本来都转成xml了,弄得差不多了才发现提取出的数据有点问题,很多地方缺空格,出现连词现象,还有不少错误,个人有点完美控,所以想自己写个小软件提取mdx内的数据,但不知词典内的数据是如何压缩编排的?求各位高手开导!

该用户从未签到

发表于 2013-5-13 11:17:23 | 显示全部楼层
高技术的活儿,祝好运!

该用户从未签到

 楼主| 发表于 2013-5-13 11:35:37 | 显示全部楼层
2# 莲花无语 0 M/ `5 M! [9 r, V, |( h
1 w3 }6 I8 y( P* c8 H. x/ O. v  K, g
谢谢!继续等高手

该用户从未签到

发表于 2013-5-13 11:50:37 | 显示全部楼层
为什么会缺空格,出现连词现象呢?

该用户从未签到

 楼主| 发表于 2013-5-13 13:50:50 | 显示全部楼层
4# xngnln
# U4 ~! l: _) g" \$ n) D3 C7 m8 h7 w' S4 L
5 o5 e4 H- e$ i) g, H3 U
我也很想知道,毕竟不是全部词都这样,还有一些乱码,而且没找全规律,处理比较棘手。

该用户从未签到

发表于 2013-5-13 16:06:13 | 显示全部楼层
高技术的活儿

该用户从未签到

发表于 2013-5-13 21:27:23 | 显示全部楼层
编写mdx用的txt文件好办,反过来就不知道了,楼主努力!

该用户从未签到

发表于 2013-5-15 18:13:38 | 显示全部楼层
mdx文件格式育supermemo的smpak格式都是一种文件包格式。% n; Y" |: \* P, ^1 o1 Z0 ~
但mdx打包的方法是采用特殊算法加密了的。如果楼主有兴趣可以找一些早期没有混淆代码的android的mdx词典软件,进行逆向工程,可能可以得到文件具体格式。我只能说到这里了。
  • TA的每日心情
    擦汗
    2023-9-2 09:16
  • 签到天数: 1103 天

    [LV.10]以坛为家III

    发表于 2013-5-15 19:55:57 | 显示全部楼层
    1# linwengk 1 W. P( l$ _1 [- y' p

    $ E( R2 I7 U: u1 Imdx,mdx格式已经全公开,参加下面讨论:+ z; E  ?9 W4 e# \' ^
    https://pdawiki.com/forum/viewthread.php?tid=10619

    该用户从未签到

     楼主| 发表于 2013-5-23 12:09:53 | 显示全部楼层
    9# spoony1971
    ( O1 N( f, p9 D7 T9 n" O- t0 t! M) k' [  a  P0 o- c6 s& E: S& M$ y

    + a: j6 r& _1 B2 D太感谢了!只是我用GetDict加正则解决了,绕了个道。好贴收藏备用。
  • TA的每日心情
    开心
    2020-6-12 14:43
  • 签到天数: 67 天

    [LV.6]常住居民II

    发表于 2016-8-8 14:15:32 | 显示全部楼层
    高技术的活儿
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-8 01:42 , Processed in 0.025211 second(s), 26 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表