掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 669|回复: 4

[教程] 给繁体词典添加简体索引的简单方法

[复制链接]
  • TA的每日心情
    开心
    2019-1-18 23:55
  • 签到天数: 230 天

    [LV.7]常住居民III

    发表于 2018-4-26 00:35:31 来自手机 | 显示全部楼层 |阅读模式
    本帖最后由 dfliaoyue 于 2018-4-26 17:34 编辑 5 [. c7 U7 ^. f( ?5 }8 N  i
    ; D# @1 P6 n" G
    因为发现一本排版很棒的台湾的国语词典(指的是一个台湾人做的教育部新编国语辞典第五版,论坛里有授权转载的),于是想加个简体索引便于查找。简单试了下,发现一个比较便捷的方法。9 {4 O& n& p; T. @. R- r
    1. 用置顶的mdict editor tools提取词条。
    + `: ?& N* n! u5 M2. 将提取的词条拷到excel里,用审阅工具的繁转简转换。# A; U( x4 \5 Y: m" `$ ]8 M8 A5 h
    3. 将词条列表在第二列再拷贝一遍。现在是第一列简体、第二列繁体。# q) z& @& A: H+ x/ d9 [
    4. 将两列选中,拷进空白txt文档。/ y# ]0 {9 }; Y7 i
    5. 用正则多行替换,去掉繁简同体的。查找项为^(.*?)    \1$ 。不要直接拷贝我写的,把一行内容加个换行拷进去,再把前后词语换成^(.*?)和\1$ 。: Z: u5 x) G- p8 o* p
    6. 现在,你已经得到了所有且不重复的简体繁体对应表了。用正则替换为mdict词典的格式即可。第一行是简体,第二行@@@LINK=繁体,第三行</>。注意不要有空行。
    0 X3 j1 v$ B" u0 ?1 H$ |4 y7. 解包原mdx,把前面得到的文本拷贝到解包出来的源文件后面,同样注意不要有空行。  y/ f& k5 r# A; V" p
    8. 用mdxbuilder重新打包。注意编码格式。' K+ e8 X7 M3 J

    3 N/ K4 F$ @+ W! y整套过程,由于现成工具多,最难的也仅仅是最基础的正则替换。注意像emedit的多行替换是需要选择多行模式的。
    $ W" j, l; [- W8 G; [% p
    9 s* C/ p* k- E) l8 `P.S. 繁体汉语词典不建议把内容转成简体。百科就随意了。

    评分

    2

    查看全部评分

    本帖被以下淘专辑推荐:

  • TA的每日心情
    开心
    2018-6-18 01:07
  • 签到天数: 102 天

    [LV.6]常住居民II

    发表于 2018-4-26 17:17:18 | 显示全部楼层
    @oversky台湾教育部国语词典
  • TA的每日心情
    无聊
    昨天 07:40
  • 签到天数: 635 天

    [LV.9]以坛为家II

    发表于 2018-4-26 19:08:05 | 显示全部楼层
    kyletruman 发表于 2018-4-26 17:17' j+ v+ a$ t6 j4 d: S
    @oversky台湾教育部国语词典
      @5 f8 A" Q& r( j& e# L
    了解了。谢谢。
  • TA的每日心情
    开心
    2018-6-30 07:01
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    发表于 2018-6-24 14:23:39 | 显示全部楼层
    用GoldenDict的话,就简单了,直接设置繁简转换就可以了,不必修改词典本身。2 |- W; K9 q2 v+ s7 @. b% ~

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?免费注册

    x
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    顶部qrcode底部
    关注公众号送论坛充值码
    关注微信公众平台
    关注微信公众号 pdawiki,获取邀请码,看文抢积分,抽奖得浮云! Follow our Wechat official account "pdawiki", get invitation codes, and play the lottery to earn points (积分)!

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2020-9-25 04:33 , Processed in 0.379073 second(s), 11 queries , MemCache On.

    Powered by Discuz! X3.4

    © 2001-2017 Comsenz Inc.

    快速回复 返回顶部 返回列表