掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 465|回复: 3

[求助] 请教如何根据规则删除词条

[复制链接]
  • TA的每日心情
    开心
    2022-9-30 14:54
  • 签到天数: 150 天

    [LV.7]常住居民III

    发表于 2017-11-22 14:29:05 | 显示全部楼层 |阅读模式
    已经照着教程用getdict把mdx的源文件提取出来了,是纯文本的txt,想精简一下词典里的词条自用,不知道怎么才能做到根据一定的规则批量删除词条,比如包含某些字符的,多音字的,部首是提手的,等等。用了置顶里的dict source editor这个软件,打开中英文mdx会乱码而且打开也有问题。mdcit多功能编辑器也用了,倒是可以导入之后以词条显示,但是依然无法很方便的精简词条。
    8 e5 E8 N- N% ]
    ) `% ]0 g6 I$ `( _9 n还希望论坛前辈不吝赐教。
  • TA的每日心情
    无聊
    2021-1-15 05:13
  • 签到天数: 271 天

    [LV.8]以坛为家I

    发表于 2017-11-29 22:07:29 | 显示全部楼层
    qchenac 发表于 2017-11-24 16:00
    . T  I% n" [8 P3 j! r9 a5 m) ?暂时琢磨出一个笨办法,用getdict提取utf8格式的txt文件,然后用sublime text之类的编辑器打开就会看到正好 ...

    0 e8 i' R- `  K3 F% o) x你这不是笨办法, 这是修改词典内容的常规方法:   mdx 转换成 txt, 然后编辑之, 之后再重新生成 mdx.8 [- V: |+ |$ k& {7 g' t" V( Z
    至于编辑工具和方法, 看个人喜好, 个人推荐使用 EmEditor, 神器, 没有之一, 至于如何使用, 其有中文版的使用说明, 慢慢摸索. 这个编辑软件的自带功能, 正则和宏结合使用, 能完成很多高难度的动作, 比如: 提取 HTML 中嵌套闭合的标签内的内容, 这个能力至少我没发现其它那个编辑软件能做到; 还有分列编辑, 排序, 筛选...; 秒开大文件...等等
  • TA的每日心情
    开心
    2022-9-30 14:54
  • 签到天数: 150 天

    [LV.7]常住居民III

     楼主| 发表于 2017-11-24 16:00:28 | 显示全部楼层
    暂时琢磨出一个笨办法,用getdict提取utf8格式的txt文件,然后用sublime text之类的编辑器打开就会看到正好是一个词条占据一行的格式了,然后学了一些基本的正则表达,就做到了选中所有包含某字符的一整行,由于文件的格式正好是一行就是一个词条这样,所以很方便了就。但是试过以mdx源文件格式提取,发现一个词条会散成数行,这样想选中所有特征词条再编辑就不那么容易了。现在还只做到这这一步,下一步试试看能不能把utf8的txt打包成mdx
  • TA的每日心情
    开心
    2022-9-30 14:54
  • 签到天数: 150 天

    [LV.7]常住居民III

     楼主| 发表于 2017-12-1 12:34:59 | 显示全部楼层
    EarthWorm 发表于 2017-11-29 22:07
    1 h1 M4 p+ b$ t$ Q) I- O你这不是笨办法, 这是修改词典内容的常规方法:   mdx 转换成 txt, 然后编辑之, 之后再重新生成 mdx.. O. @% z. w# Z( }6 A, E
    至于 ...
    8 I! i( ^# o# Q
    多谢推荐,您提到的那个功能是用正则实现的吗
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-19 13:51 , Processed in 0.042906 second(s), 10 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表