掌上百科 - PDAWIKI

用户名  找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 19624|回复: 269

[工具] 【2016.08.11 优化】Mdict词典DIY工具系列之一:词条内容提取利器,极速提取

  [复制链接]

该用户从未签到

发表于 2016-7-10 16:12:09 | 显示全部楼层 |阅读模式
本帖最后由 qiuhao1112 于 2016-8-11 20:15 编辑 ; R7 `4 q3 X5 t' \- c# t

# y$ }4 j% R: S; g# [Mdict词典DIY工具系列之一:词条内容提取利器,极速提取, m+ k# t4 |. a( z$ p+ [4 u" |. E
: w+ L" Q* Y# t* }( G) ^
==============& Z7 W2 y7 |/ P" Z/ w
2016.08.11 优化:

8 S( p$ K) K( x4 E# B修改了程序,若原文本有多个相同的词条,则不再覆盖,保留对应文本。# B" P5 b9 u* p7 a
8 y6 _! M- t9 k! \
改为百度云分享,便于更新。
3 I7 D& O' i  _* {
5 P) C. B9 O6 r& c==============4 J) Y5 G$ W. x0 \

( I: K; Z, c& d& o6 O3 H& h- ~; t' r

6 v' Q# E: j4 w. l  AMdict词典DIY工具系列:
, a" c9 W: Y$ E0 ^$ B( W) ~. @8 s5 _% a9 R/ o4 Q$ \7 m* Q: P2 W
Mdict词典DIY工具系列之一:词条内容提取利器
4 N4 z( e4 A0 P: G% \8 \. |% rMdict词典DIY工具系列之二:词条合并工具,二合一 ; z% K$ u0 z. ~, [& b
Mdict词典DIY工具系列之三:MDX文本内容提取解析工具$ e7 A. h- K4 K
Mdict词典DIY工具系列之四:词条合并工具,N合一0 {7 {1 f) {. r' d
Mdict词典DIY工具系列之五:MDX文本内容 & 词条 去重工具 : k1 \* O8 O4 R  ^
) s" Q+ \6 Z! D) X: }7 d; v

0 O/ q. }) |0 S* B" f; G, i
9 L( Z$ }8 s0 c2 X, X9 _" l之前的程序报有病毒,已重新打包上传。
$ B5 Y' }( B6 r' [5 H
* ~# ^4 @8 c5 \6 s! y3 [+ i7 y
6 V# `/ a! u6 g1 I# Z* n8 R9 c3 F# D3 D3 k: X

! j- c' Q% m0 ~Extractor from MDX by Wordlist v 2.0:
' Z. H* I2 e5 O) b0 h' y
* Y; j) u; i: i; A, }7 r) L7 ?
( z( X' ], K7 e( h2 i$ H  P& u/ L3 @# x4 c6 G% \
        使用方法:
; q/ v+ L" G' Q2 E* u# R
* B1 @. |' S2 r$ L       
# w" Z( a8 ]6 I: |4 t4 a        提取词典内容的源码文件应为Mdict词典格式的文本(.txt)文件。! t7 q6 h4 g& ]
) N/ a5 u" b: g0 r
        该程序无图形化界面,为方便使用,请把文本文件名改为阿拉伯数字或字母,方便文件名输入。
0 T3 S" O1 l  U, Y+ A+ `8 f3 S' V; U! {* R0 b4 M
        Input wordlist file name:  输入单词列表名,无需添加 .txt后缀;
& L% k+ I; s" g" _        Input source file name: 输入MDX格式的源码文件名,无需添加 .txt后缀;7 x9 j4 X+ {0 F9 @  \/ k
        1 FOR include, 0 FOR exclude:  选择1 include 模式,选择0 exclude 模式。
( O. G( D  |( A8 ]* b# c6 B+ r0 t, v) c
                                模式1: 提取包括该单词列表的内容) Q3 U( \% v" Z. g
                                模式2: 提取非包括该单词列表的内容- M: A. \" c% l1 s! e
# h* A4 }) z9 I/ x5 O2 N# i% `
===============================8 _9 m; y) c: P6 O2 @9 d  j
8 E; C9 ]- a' R
3 H2 ~! `1 ^$ G4 z% E
链接:http://pan.baidu.com/s/1bpbYkwB 密码:55po+ ]0 O7 ], z" w3 q9 L2 F3 @4 n( w

评分

1

查看全部评分

本帖被以下淘专辑推荐:

  • · 工具|主题: 8, 订阅: 5
  • TA的每日心情
    奋斗
    2022-11-19 13:01
  • 签到天数: 21 天

    [LV.4]偶尔看看III

    发表于 2016-11-28 12:14:05 | 显示全部楼层
    谢谢楼主分享,下载看下

    该用户从未签到

     楼主| 发表于 2016-7-12 11:02:38 来自手机 | 显示全部楼层
    Snowdax 发表于 2016-7-12 08:58
    % C& M9 ^( ^6 W& t; p; j其实是可以的,用custom 添加reference list即可,但该软件好像没有开源,不知道是怎么实现的

    - k6 q0 O' ], ?, W( j2 `* ^" x. ^: l/ r, x应该是我以前没发现这个功能吧   而且sunsmile大的那个速度很快  应该是用Java或者C写的  这两个我都我不会    我的脚本思路也有问题
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-12 12:45:20 | 显示全部楼层
    qiuhao1112 发表于 2016-7-12 11:02
    % Q7 [! s" a9 s) b9 }( |! [6 H应该是我以前没发现这个功能吧   而且sunsmile大的那个速度很快  应该是用Java或者C写的  这两个我都我不 ...
    , z! f$ |* G) o" C- b3 r5 \3 ]
    因为我之前做词典用过这个功能,所有隐约有一些印象
    * n: i* n: X# a' f  @python代码比较简洁,但运行速度确实不快
    % B& F3 k$ E6 |9 y8 m9 G7 M) d(其实我也是门外汉的

    该用户从未签到

     楼主| 发表于 2016-7-10 16:26:03 | 显示全部楼层
    本帖最后由 qiuhao1112 于 2016-8-7 15:09 编辑
    $ Q+ I& m8 J- [# m2 Q  ]. G6 M9 m7 T) N
    打开大文件无压力。。

    该用户从未签到

    发表于 2016-7-10 16:33:17 | 显示全部楼层
    巨巨请教一下,读取mdx用的什么python库啊?
    9 g: k& D* E4 k' L/ X$ [还有写mdx只有MDX Builder,有没有支持命令行的工具啊?

    该用户从未签到

    发表于 2016-7-10 16:51:40 | 显示全部楼层
    路过帮顶辛苦了

    该用户从未签到

    发表于 2016-7-10 18:51:50 | 显示全部楼层
    这不是很多人需要的工具吗?!

    该用户从未签到

    发表于 2016-7-10 21:47:30 来自手机 | 显示全部楼层
    真是雪中送炭呀
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-10 22:53:15 | 显示全部楼层
    咦 我记得Source Editor有类似功能
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-11 08:01:41 来自手机 | 显示全部楼层
    太好了!可以自己折腾词库啦!
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 08:43:48 来自手机 | 显示全部楼层
    楼主,我是linux用户。求原始Python脚本

    该用户从未签到

     楼主| 发表于 2016-7-11 08:49:00 | 显示全部楼层
    本帖最后由 qiuhao1112 于 2016-7-11 16:44 编辑
    4 A9 y( Q2 J8 {( ~
    lmjiao 发表于 2016-7-11 08:43
    ( i9 F& r7 I& H: x1 `楼主,我是linux用户。求原始Python脚本

    ' _/ X* u9 s7 R6 @/ P
    6 p9 T& M2 Y& f# t* I/ `' B脚本还需要修复

    点评

    感觉可以用的dict先存一下数据,然后再提取。还有Python的thread在gil的条件下是针对IO阻塞的情况用的,这里好像没有必要。。。  发表于 2016-7-11 14:45
  • TA的每日心情
    无聊
    2020-11-6 22:08
  • 签到天数: 26 天

    [LV.4]偶尔看看III

    发表于 2016-7-11 10:08:34 | 显示全部楼层
    perfect exe~

    该用户从未签到

    发表于 2016-7-11 12:49:56 | 显示全部楼层
    fnaviwwo1 发表于 2016-7-10 16:33& _) b3 P/ W( k
    巨巨请教一下,读取mdx用的什么python库啊?8 }+ \6 @( b, A+ R9 ]
    还有写mdx只有MDX Builder,有没有支持命令行的工具啊?

    8 t- o7 s3 v- T" V如何用 readmdict.py 提取 mdx/mdd 中的数据
    ; m- d6 X" u/ h9 t! J* Dhttp://jingyan.baidu.com/article/95c9d20d47583bec4e756132.html

    点评

    I really appreciate it!  发表于 2016-7-11 14:22
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-11 16:22:53 | 显示全部楼层
    谢谢楼主无私分享  ~1 w- x1 X. D- r
    开心!

    该用户从未签到

     楼主| 发表于 2016-7-11 17:05:01 | 显示全部楼层
    Snowdax 发表于 2016-7-10 22:532 h- B% [  T+ J8 w" o! e0 E& Y
    咦 我记得Source Editor有类似功能
      c2 l0 m8 E! b, k
    Source Editor  确实没有这个功能
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:07:34 来自手机 | 显示全部楼层
    qiuhao1112 发表于 2016-7-11 08:49
    . U4 o4 Q1 L5 d; a9 G% e" Q$ h8 F脚本还需要修复

    * H; u$ i0 e' f. \, P非常感谢!热切期待!
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:09:29 来自手机 | 显示全部楼层
    vbnet 发表于 2016-7-11 12:49: N5 G: ]( `% T5 X4 F
    如何用 readmdict.py 提取 mdx/mdd 中的数据
    : k* t* b+ i/ z  Zhttp://jingyan.baidu.com/article/95c9d20d47583bec4e7561 ...
    ( a0 N' ~7 I/ h$ U0 j, S7 D5 g
    楼主的可以根据单词表提取所需内容。你给的链接中只能提取全部内容。
    ; l9 Z1 {( h) F3 `; t) r  u: F1 f( {1 }1 x% W* y3 c
    对于部分人来说,楼主的按需提取功能还是很方便的。

    点评

    vb大所提供的链接只是在回应fnaviwwo1在3楼所提问的问题,并非要跟LZ的功能做比较  发表于 2016-7-12 10:07
  • TA的每日心情
    开心
    2019-6-27 08:03
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:50:36 | 显示全部楼层
    windows 10 不能用
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-12 08:58:15 | 显示全部楼层
    qiuhao1112 发表于 2016-7-11 17:05
    3 u& M) [0 f9 ?* X, B" @Source Editor  确实没有这个功能
    4 S& V4 N4 g( |: a% r4 A+ {$ d& C
    其实是可以的,用custom 添加reference list即可,但该软件好像没有开源,不知道是怎么实现的# n: d8 B8 Z# O& l, r3 y" Z- W! B$ X

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 10:21:44 | 显示全部楼层
    请问楼主没操作指南之类的,对我这样的傻鸟的挑战可不是一般小啊
    ; R. a+ b  c2 y" `6 J, f谢谢
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 10:24:43 | 显示全部楼层
    按Readme去操作了,但好像没得到什么东东。
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 11:29:20 | 显示全部楼层
    menglongma 发表于 2016-7-11 18:50
    ! W9 L; }, B6 D* I) k# t2 x9 C9 Uwindows 10 不能用
    * J6 N4 u" U* u, L
    这就难怪了
    2 h. x, v: G" H- y谢谢分享
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-22 15:20 , Processed in 0.025909 second(s), 28 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表