掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 5997|回复: 2

[索引] mdx转txt文本源码的四种方法

[复制链接]
  • TA的每日心情

    2021-10-23 19:58
  • 签到天数: 212 天

    [LV.7]常住居民III

    发表于 2020-1-28 00:21:46 | 显示全部楼层 |阅读模式
    本帖最后由 lemonlab 于 2020-1-28 03:46 编辑
    9 ~; D% H1 z1 Y9 s2 e
    ( g. p$ g2 H! \8 _! Q4 `7 ]一、[[2018-3-3]MdxExport3.5-MDX与MDD资源导出小工具。](https://www.pdawiki.com/forum/thread-17709-1-1.html)1 T4 j- d% M4 p* ^; l5 e8 e5 x
        知道的人最多的老牌工具啦,据说是GetDict2_6的升级版2 f* o; E8 e  a

    % _9 A, d; H' ^; m& x8 @3 O二、[[1.0.9] PatchO8C repacked - Extract MDX/MDD ](https://www.pdawiki.com/forum/fo ... 8848&extra=page%3D1)- i, }6 X9 |, D( ~; v
    1. 3. 以 BIG5 编码时,最好手动选 CP950 或是香港的 BIG5HKSCS。用 Python 的 BIG5 会少几个字,例如你说的「裏」。当字典編码是 BIG5 时,可以两种解码 CP950 或 BIG5HKSCS 都试试看,这些当年都统称 BIG5,结果会不太一样。
      5 B7 @& W) ?7 C3 |, n
    2. 4. 新增 Decoding error 的处理方式。 之前 Crash 或转不出来都是解码的问题,有些是 Python 的限制。
      0 h% n% w) ^  ^. O! m/ ~  P+ R
    3.     a. Ignore: 直接把解不出来的字删除。! b, M4 p2 W/ I  b0 c; z- Y
    4.     b. Replace: 把解不出来的字以�替换。所以解出来後要注意查找这个字,再和原版比较校对。
      ( V  M; c& i! `  C; w2 Y% k! t' m
    5.     c. Strict: 这就是之前的模式。一报错,马上就停止执行
      / U% ~( i6 K$ H. _1 {1 s5 S: X
    6. ! M" s; @" j. B% o
    7. 1.0.9 2016.11.29 unescape5 [: _) T' B) t
    8. 按单词表包含或排除提取到粘贴板
      & y. W5 K# n1 o  p+ J! q! |& s
    9. note:, ]0 X+ \0 \8 z
    10. hit ESC 3 times 按{Esc}三次有扩展功能,加载单词表,按Open打开txt,csv逗号分隔文件
        `# J8 `" ]( A
    11. all: paste from csv: (^[^\n]+)\n(.+)\n(</>)$,,\1\2\3  
      2 F8 ?. H7 W" v6 M
    12. key: paste from csv: (^[^\n]+)\n(.+)\n(</>)$,,\1      提取词头
      7 o7 Q: o- q, ~6 }) E- D4 L' z# ^
    13. definition: paste from csv: (^[^\n]+)\n(.+)\n(</>)$,,\2    仅仅提取定义
    复制代码
    4 J$ T9 `" o) N7 y! e( O0 ^
    # j) Z: q8 m1 C; r+ c6 F8 A- m9 u: x* j. P
    三、pyglossary  [pyglossary 词典格式转换 ](https://www.pdawiki.com/forum/fo ... &tid=37718&ctid=514)
    4 d& ^" l' ^( S    全能手,能在多种词典源文件格式之间转换,很强大,不过要安装python3,
    # K' c: M* R! h. X" n; F% Y    有窗口界面,运行 run-Tkinter-based interface.bat6 J2 W& P! O5 ?/ p- ^. W! q* T
    四、[Dict Source Editor【2014.08.24】](https://www.pdawiki.com/forum/fo ... mp;extra=#pid178848)+ |- {' p- c1 G; U5 ]. G
      Export-Custom可以按照自己的需求导出指定的词条文本。例如只导出自己需要的某些词条,或者不导出某些词条。只需将你需要导出的词条保存到一个文本文件,每个词条一行,然后指定这个文件即可。% O! C' a9 ]. @. m" L+ `9 y
    ; _& T# u0 V) o  [$ [6 ]
    [mdict-utils mdict 打包解包工具 ](https://www.pdawiki.com/forum/thread-33808-1-1.html)
    ( D. r8 N) _* f: ], z" w    个人测试用不起来,命令行提示找不到模块
    : p0 o$ U$ N" t
    1 e$ E% Z# n* E; g另外还有几个用python来读取mdx的,玩anki的时候经常遇到& R( u1 @, ]2 r3 `. D$ K% Q, B! f, ^0 w
      1,mdict_reader! ]/ n' @& I; |, U$ ], D
      2,mdx-server( ?. g% v# J' @' a' n; e
      3,flask-mdict
    3 B/ I# Z  z: T0 b. {; F5 q! @# R/ b8 u/ @1 Y  J. i( ?
    在转出txt源文件后,Mdict Editor Tool v2.0.35  -- 多功能个性化词典制作工具& N* {& D1 b, }% Z8 S
    这工具按自定义单词表提取很好使# ~+ q- W6 t5 z: G# F+ v+ B
    ) e8 E6 n/ j2 c3 ^! h
    [xwang / mdict-analysis — Bitbucket](https://bitbucket.org/xwang/mdict-analysis/src/default/)如果谈到最有贡献达到当然是mdict的作者R大,和goldendict的俄罗斯大侠
    7 P7 ~8 N& z1 D; T1 A除此之外还有一位也是不能被忘记的就是 [xwang / mdict-analysis — Bitbucket](https://bitbucket.org/xwang/mdict-analysis/src/default/)& ]; V* X1 k- Q  Z
    mdx格式的解密者,如果没有解密,mdx无法被更多词典壳体支持,金鱼和欧路估计也难有今天的影响力
    . a$ ^6 P' m/ J8 @" C印证了一个规律,一个有影响力的工具必须得和chrome,python沾点边( B$ P& w+ C- W+ ~
    2 ?3 a' b  \" S2 R5 N
    最后一并感谢所有这些默默奉献的大神
    1 \" `2 V: _& y* Q' b0 W0 v3 \2 F; y/ y5 B
    ' h; j) i  ]& s

    评分

    2

    查看全部评分

  • TA的每日心情
    擦汗
    2023-2-4 10:31
  • 签到天数: 302 天

    [LV.8]以坛为家I

    发表于 2020-1-28 13:07:54 | 显示全部楼层
    谢谢楼主分享精品文章

    该用户从未签到

    发表于 2023-2-16 01:17:45 | 显示全部楼层
    Mdict Editor Tool 可以将txt转为mdx, 我得学学
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-26 00:03 , Processed in 0.041972 second(s), 9 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表