掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 716|回复: 6

[求助] mdx 抽取和剔除工具

[复制链接]
  • TA的每日心情

    2019-9-23 23:38
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2019-12-16 21:41:39 | 显示全部楼层 |阅读模式
    本帖最后由 lbhl 于 2019-12-16 21:44 编辑 0 ~$ ~1 A4 Y4 \* {; A$ |5 S: c
    3 Q4 e9 o/ Q2 M
    什么工具可以:
    # C- K- Q1 B$ W* u+ N( B- ](1)将a.mdx中含有的b.mdx中的词条抽取出来后生成新的c.mdx
    % q- c0 g& k5 r' k3 i9 j(2)将a.mdx中含有的b.mdx中的词条剔除后的剩余部分生成新的c.mdx
    $ G- e. R: B7 ]( ^# f; Z4 y- h. _(3)假设b.txt是一个纯文本文件,每行是一个单词,无任何义项和解释例句等。将a.mdx中含有的b.txt中的词条抽取出来后生成新的c.mdx
    7 m3 k3 `/ L, E# }* r( S(4)将a.mdx中含有的b.txt中的词条剔除后的剩余部分生成新的c.mdx9 J2 ?% a8 ?) S& H% a) |
    (5)将a.mdx 和 b.mdx 合并成一个c.mdx,a.mdx 和 b.mdx共有的单词内容叠加且只占一个词条* r8 X/ C7 k) O, ~

    该用户从未签到

    发表于 2019-12-16 22:41:54 | 显示全部楼层
  • TA的每日心情
    开心
    2019-5-28 07:39
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2019-12-17 08:43:05 | 显示全部楼层
    所以,要懂得正则表达式。不然,求助吧。

    该用户从未签到

    发表于 2019-12-17 10:51:31 | 显示全部楼层
    强强强强强强强强强强强强强强强强强强强强强强请问

    评分

    1

    查看全部评分

  • TA的每日心情
    奋斗
    2020-11-15 11:37
  • 签到天数: 249 天

    [LV.8]以坛为家I

    发表于 2019-12-17 20:45:27 | 显示全部楼层
    如果不想学python,perl编程的话;提供一个思路,用EmEditor+Excel。
  • TA的每日心情
    开心
    2019-3-26 21:36
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2019-12-25 22:41:07 | 显示全部楼层
    该板块置顶帖子Dict Source Editor就可以做到。
    9 l1 \# K! `, {* P3 D# Z(1)获取b.mdx词表,提取a.mdx里的条目。
    + t7 h+ s; e, o8 K: e0 |& G8 F' }; m(2)也是获取b.mdx的词表,去除a.mdx里b.mdx里的所有条目。4 p/ H5 L9 G) v3 R. P
    (3)和(4)和(1)、(3)一样,Dict Source Editor同时支持mdx和mdx的txt源文件。
      {  @% V8 Q# Y% _1 oDict Source Editor也支持合并词条,当然是在同一个条目下两个body内容。
  • TA的每日心情
    开心
    2019-8-21 08:44
  • 签到天数: 163 天

    [LV.7]常住居民III

    发表于 2019-12-27 18:14:32 | 显示全部楼层
    利用 Python 的 readmdict 包可能三五十行左右码的样子吧
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-3-28 19:48 , Processed in 0.033475 second(s), 9 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表