掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 585|回复: 3

[求助] 请教如何根据规则删除词条

[复制链接]
  • TA的每日心情
    开心
    2024-6-11 13:12
  • 签到天数: 151 天

    [LV.7]常住居民III

    发表于 2017-11-22 14:29:05 | 显示全部楼层 |阅读模式
    已经照着教程用getdict把mdx的源文件提取出来了,是纯文本的txt,想精简一下词典里的词条自用,不知道怎么才能做到根据一定的规则批量删除词条,比如包含某些字符的,多音字的,部首是提手的,等等。用了置顶里的dict source editor这个软件,打开中英文mdx会乱码而且打开也有问题。mdcit多功能编辑器也用了,倒是可以导入之后以词条显示,但是依然无法很方便的精简词条。
    6 y0 a( `1 z. V9 C) n
    ! N! g; D( n! C; I/ C还希望论坛前辈不吝赐教。
  • TA的每日心情
    无聊
    2021-1-15 05:13
  • 签到天数: 271 天

    [LV.8]以坛为家I

    发表于 2017-11-29 22:07:29 | 显示全部楼层
    qchenac 发表于 2017-11-24 16:00& Q0 J" w1 R9 x$ S' a9 `/ t! X
    暂时琢磨出一个笨办法,用getdict提取utf8格式的txt文件,然后用sublime text之类的编辑器打开就会看到正好 ...
    6 U4 E/ M1 n. h  S
    你这不是笨办法, 这是修改词典内容的常规方法:   mdx 转换成 txt, 然后编辑之, 之后再重新生成 mdx.
    , ]0 V0 D' O) |1 o9 ^' }6 [至于编辑工具和方法, 看个人喜好, 个人推荐使用 EmEditor, 神器, 没有之一, 至于如何使用, 其有中文版的使用说明, 慢慢摸索. 这个编辑软件的自带功能, 正则和宏结合使用, 能完成很多高难度的动作, 比如: 提取 HTML 中嵌套闭合的标签内的内容, 这个能力至少我没发现其它那个编辑软件能做到; 还有分列编辑, 排序, 筛选...; 秒开大文件...等等
  • TA的每日心情
    开心
    2024-6-11 13:12
  • 签到天数: 151 天

    [LV.7]常住居民III

     楼主| 发表于 2017-11-24 16:00:28 | 显示全部楼层
    暂时琢磨出一个笨办法,用getdict提取utf8格式的txt文件,然后用sublime text之类的编辑器打开就会看到正好是一个词条占据一行的格式了,然后学了一些基本的正则表达,就做到了选中所有包含某字符的一整行,由于文件的格式正好是一行就是一个词条这样,所以很方便了就。但是试过以mdx源文件格式提取,发现一个词条会散成数行,这样想选中所有特征词条再编辑就不那么容易了。现在还只做到这这一步,下一步试试看能不能把utf8的txt打包成mdx
  • TA的每日心情
    开心
    2024-6-11 13:12
  • 签到天数: 151 天

    [LV.7]常住居民III

     楼主| 发表于 2017-12-1 12:34:59 | 显示全部楼层
    EarthWorm 发表于 2017-11-29 22:07
    2 P) X' @2 q/ w" p; x7 I你这不是笨办法, 这是修改词典内容的常规方法:   mdx 转换成 txt, 然后编辑之, 之后再重新生成 mdx.$ |/ [4 X$ b( v/ n+ s
    至于 ...

    ( t$ Q7 T4 F3 ^' v5 ^多谢推荐,您提到的那个功能是用正则实现的吗
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-7 01:01 , Processed in 0.020171 second(s), 22 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表