掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1046|回复: 6

[求助] mdx 抽取和剔除工具

[复制链接]
  • TA的每日心情

    2019-9-23 23:38
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2019-12-16 21:41:39 | 显示全部楼层 |阅读模式
    本帖最后由 lbhl 于 2019-12-16 21:44 编辑
    1 U/ L% ]  _. B$ |: e
    , c1 V% v. D/ O' x7 u8 \7 H: _什么工具可以:" v; u9 f. K/ G! C6 q4 u
    (1)将a.mdx中含有的b.mdx中的词条抽取出来后生成新的c.mdx( {7 W1 l  i" ]3 k7 j  l
    (2)将a.mdx中含有的b.mdx中的词条剔除后的剩余部分生成新的c.mdx
    2 k6 m. R! n2 `9 t7 w) U6 r(3)假设b.txt是一个纯文本文件,每行是一个单词,无任何义项和解释例句等。将a.mdx中含有的b.txt中的词条抽取出来后生成新的c.mdx) o5 H( I, W' x$ y: @9 V
    (4)将a.mdx中含有的b.txt中的词条剔除后的剩余部分生成新的c.mdx
    " Y. E. C  S( `% V+ w(5)将a.mdx 和 b.mdx 合并成一个c.mdx,a.mdx 和 b.mdx共有的单词内容叠加且只占一个词条
    ) }: y$ ?! t9 G1 [

    该用户从未签到

    发表于 2019-12-16 22:41:54 | 显示全部楼层
  • TA的每日心情
    开心
    2019-5-28 07:39
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2019-12-17 08:43:05 | 显示全部楼层
    所以,要懂得正则表达式。不然,求助吧。

    该用户从未签到

    发表于 2019-12-17 10:51:31 | 显示全部楼层
    强强强强强强强强强强强强强强强强强强强强强强请问

    评分

    1

    查看全部评分

  • TA的每日心情
    奋斗
    2020-11-15 11:37
  • 签到天数: 249 天

    [LV.8]以坛为家I

    发表于 2019-12-17 20:45:27 | 显示全部楼层
    如果不想学python,perl编程的话;提供一个思路,用EmEditor+Excel。
  • TA的每日心情
    开心
    2019-3-26 21:36
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2019-12-25 22:41:07 | 显示全部楼层
    该板块置顶帖子Dict Source Editor就可以做到。+ R$ {6 r8 V+ ^: @/ H% P
    (1)获取b.mdx词表,提取a.mdx里的条目。
    ) P8 S) m$ [6 X) D+ I(2)也是获取b.mdx的词表,去除a.mdx里b.mdx里的所有条目。! [6 o1 m! K+ a/ ~; \
    (3)和(4)和(1)、(3)一样,Dict Source Editor同时支持mdx和mdx的txt源文件。4 w, }/ o; D8 h! q0 f/ V9 r3 _& S3 L
    Dict Source Editor也支持合并词条,当然是在同一个条目下两个body内容。
  • TA的每日心情
    开心
    2019-8-21 08:44
  • 签到天数: 163 天

    [LV.7]常住居民III

    发表于 2019-12-27 18:14:32 | 显示全部楼层
    利用 Python 的 readmdict 包可能三五十行左右码的样子吧
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-8 06:31 , Processed in 0.023120 second(s), 25 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表