掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 9576|回复: 3

[索引] mdx转txt文本源码的四种方法

[复制链接]
  • TA的每日心情

    2021-10-23 19:58
  • 签到天数: 212 天

    [LV.7]常住居民III

    发表于 2020-1-28 00:21:46 | 显示全部楼层 |阅读模式
    本帖最后由 lemonlab 于 2020-1-28 03:46 编辑
    0 [2 Y2 S" \( V* _+ d4 Q% a& z
    & G# r1 ^( M$ ?/ T8 H$ s2 g一、[[2018-3-3]MdxExport3.5-MDX与MDD资源导出小工具。](https://www.pdawiki.com/forum/thread-17709-1-1.html)+ x/ ]+ l: V3 x+ s6 _1 _; J
        知道的人最多的老牌工具啦,据说是GetDict2_6的升级版$ Z1 h, c1 x; U  _

    1 e1 @# K- g/ B- F4 s' d二、[[1.0.9] PatchO8C repacked - Extract MDX/MDD ](https://www.pdawiki.com/forum/fo ... 8848&extra=page%3D1)( @6 f/ V0 y( C3 W6 _6 M
    1. 3. 以 BIG5 编码时,最好手动选 CP950 或是香港的 BIG5HKSCS。用 Python 的 BIG5 会少几个字,例如你说的「裏」。当字典編码是 BIG5 时,可以两种解码 CP950 或 BIG5HKSCS 都试试看,这些当年都统称 BIG5,结果会不太一样。/ R, S! w! _5 b
    2. 4. 新增 Decoding error 的处理方式。 之前 Crash 或转不出来都是解码的问题,有些是 Python 的限制。
      $ d) ~. v. }3 J
    3.     a. Ignore: 直接把解不出来的字删除。
      8 O, x  Q0 c) ]5 b& I1 D7 k- Z
    4.     b. Replace: 把解不出来的字以�替换。所以解出来後要注意查找这个字,再和原版比较校对。8 r/ {% s+ s/ ^% W) X& v, y  c
    5.     c. Strict: 这就是之前的模式。一报错,马上就停止执行
      # _' m8 q% H% a! T
    6. " b. W" ^# \3 E( r! G8 H. W1 n
    7. 1.0.9 2016.11.29 unescape; a  j3 H& m: i5 e. P
    8. 按单词表包含或排除提取到粘贴板2 R* ]% x! n  P( r% V: `
    9. note:
      - K$ g7 f% }" M7 w/ o) x( I
    10. hit ESC 3 times 按{Esc}三次有扩展功能,加载单词表,按Open打开txt,csv逗号分隔文件
      # v. w( z2 ]- I8 J( U- X( z
    11. all: paste from csv: (^[^\n]+)\n(.+)\n(</>)$,,\1\2\3  
      8 r, k8 q! B5 @% E
    12. key: paste from csv: (^[^\n]+)\n(.+)\n(</>)$,,\1      提取词头- h3 U/ b, q3 A- i
    13. definition: paste from csv: (^[^\n]+)\n(.+)\n(</>)$,,\2    仅仅提取定义
    复制代码
    ) Q, i3 x% v! I: s; ~, m

    7 N! l5 C' [8 n& S2 G+ T( n三、pyglossary  [pyglossary 词典格式转换 ](https://www.pdawiki.com/forum/fo ... &tid=37718&ctid=514)
    : t2 W9 {$ _- O$ D  ^: C    全能手,能在多种词典源文件格式之间转换,很强大,不过要安装python3,/ W8 S' j- R- t- l
        有窗口界面,运行 run-Tkinter-based interface.bat
    & |& G& N0 d0 g四、[Dict Source Editor【2014.08.24】](https://www.pdawiki.com/forum/fo ... mp;extra=#pid178848)
    6 n3 A0 D; u: I7 U. m  Export-Custom可以按照自己的需求导出指定的词条文本。例如只导出自己需要的某些词条,或者不导出某些词条。只需将你需要导出的词条保存到一个文本文件,每个词条一行,然后指定这个文件即可。7 U" V) S; u! Q) r
    " Q3 I4 H1 y) [+ F
    [mdict-utils mdict 打包解包工具 ](https://www.pdawiki.com/forum/thread-33808-1-1.html)
    ( a! E& V$ h# _3 c    个人测试用不起来,命令行提示找不到模块
    9 U$ g, X1 K' M5 t6 A- n: y- C+ H
    - ^1 b, h# Z" E( a2 i* i: l; v另外还有几个用python来读取mdx的,玩anki的时候经常遇到7 O2 a5 @8 q: W8 o- G+ m
      1,mdict_reader
    9 E1 f. h3 ]* }- ^. ~. A3 e  2,mdx-server4 v' p  E$ L' v# A
      3,flask-mdict4 r3 D% q% g4 U' I
    , ~" D8 F4 @$ A* u
    在转出txt源文件后,Mdict Editor Tool v2.0.35  -- 多功能个性化词典制作工具
    % J% O$ I6 w5 E1 G+ i! ~这工具按自定义单词表提取很好使
    & G% P- L' B, T9 a% n2 G" X- Q
    $ F* u' a) t! w; O [xwang / mdict-analysis — Bitbucket](https://bitbucket.org/xwang/mdict-analysis/src/default/)如果谈到最有贡献达到当然是mdict的作者R大,和goldendict的俄罗斯大侠
    2 |0 m3 N! t) D- L/ L! ]: @% l6 P: z$ g除此之外还有一位也是不能被忘记的就是 [xwang / mdict-analysis — Bitbucket](https://bitbucket.org/xwang/mdict-analysis/src/default/)0 E$ P1 {$ T7 M8 k
    mdx格式的解密者,如果没有解密,mdx无法被更多词典壳体支持,金鱼和欧路估计也难有今天的影响力0 R. N" j5 |; Y2 V$ {1 R
    印证了一个规律,一个有影响力的工具必须得和chrome,python沾点边
    ; j' @- i: E+ t+ N+ a2 I1 Y$ d, Q
    / b! w  c) b$ F$ N& F1 ?* u! c1 b最后一并感谢所有这些默默奉献的大神
    4 X$ h2 i6 q2 N  q' ]
    # }) q* S9 d; o0 h
      |8 o+ ^5 R& ^6 e* j) o, {

    评分

    2

    查看全部评分

  • TA的每日心情
    擦汗
    2023-2-4 10:31
  • 签到天数: 302 天

    [LV.8]以坛为家I

    发表于 2020-1-28 13:07:54 | 显示全部楼层
    谢谢楼主分享精品文章

    该用户从未签到

    发表于 2023-2-16 01:17:45 | 显示全部楼层
    Mdict Editor Tool 可以将txt转为mdx, 我得学学

    该用户从未签到

    发表于 2024-8-28 21:39:39 | 显示全部楼层
    想问一下楼主,有没有批量一次性将多个mdx文件转化为txt格式的方法,楼主分享的方法只能一个一个转化
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-7-9 19:47 , Processed in 0.020973 second(s), 22 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表