掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 395|回复: 8

[讨论] 是否有办法恢复词条的原始排序

[复制链接]
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2020-7-14 08:03:43 | 显示全部楼层 |阅读模式
    这是原始的源文件,排序是乱序 53412:
    3 l, {" @* t$ ^! x6 l% y4 Q4 {5 W
    2 P( X2 e$ X2 _4 h
    1. 55 s5 e$ k" I: X
    2. 5: v6 o( J# [' a( V" A+ M
    3. </>
      & c, C! r0 W, s. o7 {& H
    4. 3
      ) j& ]6 q+ k  e+ ], h0 X! \
    5. 3
      6 v* z  i; }0 c, [/ R3 L3 m
    6. </>
      8 S6 M$ j5 U1 H4 O
    7. 4
      - P# `6 t8 v" x; n; K2 \* R
    8. 4: W, T% ~8 w( k, t) E) q
    9. </>
      9 V0 S$ x2 W. U6 ^" ~/ y
    10. 1
      $ {( I; }; J8 d3 d
    11. 1/ ~# Z' `) c& _* w
    12. </>3 v! Y; ?1 i8 W# T( e
    13. 2' e2 g5 V+ g6 a0 |9 y" z% y
    14. 2) f7 `. b! g$ p' X" N, N
    15. </>- d1 s% O/ V8 M% w0 Z; x. x* S: a
    复制代码

    4 G) h4 e6 a# J1 D6 u" \7 m% e  N5 Q/ X% n& ]) e9 b
    但一旦用MdxBuilder编译为mdx,并用MdxExport将这个mdx导出为txt后,其顺序就变成升序12345了:- `2 h4 R! X  n7 x8 W$ _! P

    6 \4 R' I% z' w0 ^4 W; G& }' S
    1. 1: ^1 R7 K( E; A0 T1 u/ _
    2. 1
      - D) v  P- d4 B  y7 o. |
    3. </>
      * m0 u  P' ?+ w, ~% K
    4. 2
      ; {# `* v! N2 ^- ?7 o8 g8 L2 N2 g
    5. 2
      7 |: l$ W) C0 [. X+ O$ R9 `: k  b
    6. </># r: j) p- T* O9 O
    7. 3
      ' U5 ]! @/ z/ S9 |& E: ]' `, q
    8. 3( y+ X7 \) \0 h' {
    9. </>
      / J6 F  J- g- e$ c: l* V/ x  _) P
    10. 4' C& i( V5 h, M: Q/ P
    11. 4  x2 _; O- d6 U) X. v# v1 G
    12. </>
      9 V6 A0 h* E- v; }+ J
    13. 58 L  G; `  Q4 o/ p/ i0 C0 B
    14. 5, c( C6 k6 x/ K( K! v% F
    15. </>% _/ S: |+ L8 j9 |9 Y
    复制代码

    7 Z3 z0 D* i! v- g, S鉴于原始词条的排序信息对某些词典很重要,请教:mdx中是否还保留有原始词条的排序信息?如果包含有原始的排序信息,如何才能导出为带有原始排序的源文件?
      O) `. W8 l6 w1 Z, ]  K& d- V& b2 k* X3 ^2 Z
  • TA的每日心情
    开心
    2019-1-18 23:55
  • 签到天数: 230 天

    [LV.7]常住居民III

    发表于 2020-7-14 08:43:21 | 显示全部楼层
    我记得这么捣腾不会改顺序的呀?

    点评

    这是错觉。  发表于 2020-7-14 09:16
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

     楼主| 发表于 2020-7-14 09:19:47 | 显示全部楼层
    dfliaoyue 发表于 2020-7-14 08:43
    % X6 X2 D' h3 C我记得这么捣腾不会改顺序的呀?

    4 _. s  w( ?8 H9 ?' @+ k欢迎继续捣腾实验
    6 ^7 N7 [1 G1 W. e. [: `6 j, @0 \9 n; `2 s8 l

    + k( _/ Z* _  R, y- _" N

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2020-7-14 09:56:43 | 显示全部楼层
    不行,mdx的格式设计的时候就是照unicode的顺序排
    , s2 d" D0 L# o- O) l- K% Y$ _, U6 V/ ~8 `7 s
    这么设计有好有坏,不过对汉语类词典而言,最大的好处就是做好以后,一眼能看出某些问题(乱码、异常符号)
      t- u  a' f( \" y; @) S" T( H" ~4 b+ z  J. D8 g
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

     楼主| 发表于 2020-7-14 10:26:38 | 显示全部楼层
    klwo2 发表于 2020-7-14 09:56- M( a& c3 @& t6 K
    不行,mdx的格式设计的时候就是照unicode的顺序排6 e" S2 \# j7 k4 G- ~

    * F" C9 T+ T( [# P6 q( W这么设计有好有坏,不过对汉语类词典而言,最大的好处就 ...
    + w3 m3 p) Y; }& n  \) ^
    感谢答疑!

    该用户从未签到

    发表于 2020-7-14 11:22:43 | 显示全部楼层
    序列有价值的词典,制作时就加上序号,将来还原就容易了
  • TA的每日心情
    无聊
    2023-9-30 01:43
  • 签到天数: 231 天

    [LV.7]常住居民III

    发表于 2020-7-14 12:25:27 | 显示全部楼层
    保留原始文件,每次修改在原始数据上面改了再打包,我一般不相信可逆性
  • TA的每日心情
    开心
    2022-1-31 08:58
  • 签到天数: 252 天

    [LV.8]以坛为家I

    发表于 2020-7-15 08:25:48 | 显示全部楼层
    我只用过Mac下的打包工具,writemdict.py这个文件中,在生成mdx的时候,函数_build_offset_table中会对key进行排序。windows下mdxbuilder是否有类似的python代码,你可以看一下。我的理解是注释掉排序代码应该就可以实现你的要求。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-26 08:04 , Processed in 0.050779 second(s), 12 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表