掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 27228|回复: 269

[工具] 【2016.08.11 优化】Mdict词典DIY工具系列之一:词条内容提取利器,极速提取

  [复制链接]

该用户从未签到

发表于 2016-7-10 16:12:09 | 显示全部楼层 |阅读模式
本帖最后由 qiuhao1112 于 2016-8-11 20:15 编辑
* ?+ r" Z' v8 T9 v
9 p0 l) y( i& eMdict词典DIY工具系列之一:词条内容提取利器,极速提取
$ N% A/ a) l6 J1 E: L* W3 \& |( w% [  m4 s( U
==============- y( W3 v9 E; w+ N1 Q" d$ J
2016.08.11 优化:
( r6 e4 f. a8 E9 j! y
修改了程序,若原文本有多个相同的词条,则不再覆盖,保留对应文本。
( O7 I7 B2 b) |! K& S* ^3 j
7 D/ d" b" N9 Q4 h% s改为百度云分享,便于更新。. {) O; ~7 j: G7 f0 y) n
! L/ I7 K/ [# K! U- O8 g9 l2 \
==============
9 \1 p% C- v  O6 J. N& @; k# t5 b7 u

$ m; e- y1 H* y' k
0 k$ [9 _) I# K! V8 SMdict词典DIY工具系列:* |! D+ C( k8 i$ X2 d; A  P
% E3 l. E$ D  a- ^
Mdict词典DIY工具系列之一:词条内容提取利器
( S" b  E% k9 q1 S3 U# f/ A( ], AMdict词典DIY工具系列之二:词条合并工具,二合一 & _  _3 U% ^6 U+ g
Mdict词典DIY工具系列之三:MDX文本内容提取解析工具
+ e0 `, N! g% N- h; |/ sMdict词典DIY工具系列之四:词条合并工具,N合一
" K% _( p3 ~9 B+ TMdict词典DIY工具系列之五:MDX文本内容 & 词条 去重工具
: V) T$ g( y' u
' @5 g3 [9 B- j* E. h0 l

  J) t8 ~9 \8 u  y% j7 D; g
  J  A3 M8 Y$ x# @之前的程序报有病毒,已重新打包上传。
! J5 q) P1 e5 \" t, P6 L
) K% D( [! p6 g% z; U# n& n: _: Y( D& N, W, l0 y; o& i- D
% M) q+ P) o7 g

: A4 t* R  }. i  `' \* n+ ~Extractor from MDX by Wordlist v 2.0:) X& H  z# @; E, x" S9 }, M

; Y+ J" W1 ?4 |2 \& p9 q% r" _5 I( \5 K1 ]! F
' s6 k* o- P& v3 U* _1 g4 R* D% h7 g
        使用方法:
( L. U# }* h8 K5 a( f. l
0 a, w' I3 Y$ l. Q, D) l        . C/ F$ l2 {9 H% u' Q+ f) ?4 o
        提取词典内容的源码文件应为Mdict词典格式的文本(.txt)文件。0 }- R1 ~: m  d7 t1 r
/ i- L: H( ]$ t  l
        该程序无图形化界面,为方便使用,请把文本文件名改为阿拉伯数字或字母,方便文件名输入。9 b5 x/ @" X  [5 n0 n" E; O
) e5 ]) P% J9 u) w' ^0 G
        Input wordlist file name:  输入单词列表名,无需添加 .txt后缀;
1 ~/ w" c8 F. T) h% M  s' h# z9 N        Input source file name: 输入MDX格式的源码文件名,无需添加 .txt后缀;
- ^/ M" Y- ]+ d5 |" J        1 FOR include, 0 FOR exclude:  选择1 include 模式,选择0 exclude 模式。
' v; t5 O+ _2 _# u2 h  a! ^" Z% {7 x" l  J# J' O
                                模式1: 提取包括该单词列表的内容
; S) y: c3 B8 f! n, O& i                                模式2: 提取非包括该单词列表的内容7 P; E" Z# Z* e0 s- Z, ]
* ?- ]! h) z. T. m# ]6 W" H
===============================0 Z2 M! B, d9 }* c( [- p' ~
/ C; c3 u' @3 L9 \% c
6 ~) M  S4 R. \  P3 w: ]9 u2 V
链接:http://pan.baidu.com/s/1bpbYkwB 密码:55po
( j# P* j# `& z' ~: u2 R: q5 S

评分

1

查看全部评分

本帖被以下淘专辑推荐:

  • · 工具|主题: 8, 订阅: 5
  • TA的每日心情
    奋斗
    2022-11-19 13:01
  • 签到天数: 21 天

    [LV.4]偶尔看看III

    发表于 2016-11-28 12:14:05 | 显示全部楼层
    谢谢楼主分享,下载看下

    该用户从未签到

     楼主| 发表于 2016-7-12 11:02:38 来自手机 | 显示全部楼层
    Snowdax 发表于 2016-7-12 08:58( a+ L0 |7 K" V4 K, h9 N  ^
    其实是可以的,用custom 添加reference list即可,但该软件好像没有开源,不知道是怎么实现的
    - s! X. E# i, p5 f8 H$ D
    应该是我以前没发现这个功能吧   而且sunsmile大的那个速度很快  应该是用Java或者C写的  这两个我都我不会    我的脚本思路也有问题
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-12 12:45:20 | 显示全部楼层
    qiuhao1112 发表于 2016-7-12 11:02* `, d" m: d7 Q5 h: G) ?
    应该是我以前没发现这个功能吧   而且sunsmile大的那个速度很快  应该是用Java或者C写的  这两个我都我不 ...

    ) Q" F1 T# h, D' U因为我之前做词典用过这个功能,所有隐约有一些印象
    5 L; z4 D0 _3 d7 Y' K6 A* ~# dpython代码比较简洁,但运行速度确实不快, I; X  R( V  w7 v
    (其实我也是门外汉的

    该用户从未签到

     楼主| 发表于 2016-7-10 16:26:03 | 显示全部楼层
    本帖最后由 qiuhao1112 于 2016-8-7 15:09 编辑
    2 S* t- {8 g9 J9 \
    : d- ]; d, S3 h) ~  [0 C& o1 j打开大文件无压力。。

    该用户从未签到

    发表于 2016-7-10 16:33:17 | 显示全部楼层
    巨巨请教一下,读取mdx用的什么python库啊?
    9 e7 ]9 f( G" x还有写mdx只有MDX Builder,有没有支持命令行的工具啊?

    该用户从未签到

    发表于 2016-7-10 16:51:40 | 显示全部楼层
    路过帮顶辛苦了

    该用户从未签到

    发表于 2016-7-10 18:51:50 | 显示全部楼层
    这不是很多人需要的工具吗?!

    该用户从未签到

    发表于 2016-7-10 21:47:30 来自手机 | 显示全部楼层
    真是雪中送炭呀
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-10 22:53:15 | 显示全部楼层
    咦 我记得Source Editor有类似功能
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-11 08:01:41 来自手机 | 显示全部楼层
    太好了!可以自己折腾词库啦!
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 08:43:48 来自手机 | 显示全部楼层
    楼主,我是linux用户。求原始Python脚本

    该用户从未签到

     楼主| 发表于 2016-7-11 08:49:00 | 显示全部楼层
    本帖最后由 qiuhao1112 于 2016-7-11 16:44 编辑
    + X1 O3 [# X" a5 x# v0 P
    lmjiao 发表于 2016-7-11 08:43
    6 i0 U, s  U, r8 G/ Q; f, Y楼主,我是linux用户。求原始Python脚本
    2 K+ G5 L7 A) A8 l2 F( R3 ?
    ; o1 ~7 R* E" k
    脚本还需要修复

    点评

    感觉可以用的dict先存一下数据,然后再提取。还有Python的thread在gil的条件下是针对IO阻塞的情况用的,这里好像没有必要。。。  发表于 2016-7-11 14:45
  • TA的每日心情
    无聊
    2020-11-6 22:08
  • 签到天数: 26 天

    [LV.4]偶尔看看III

    发表于 2016-7-11 10:08:34 | 显示全部楼层
    perfect exe~

    该用户从未签到

    发表于 2016-7-11 12:49:56 | 显示全部楼层
    fnaviwwo1 发表于 2016-7-10 16:33- v6 t& t6 r) Y1 {( {& s- C
    巨巨请教一下,读取mdx用的什么python库啊?
      o% [; }7 c2 W还有写mdx只有MDX Builder,有没有支持命令行的工具啊?
    # @7 R; ~& l9 k2 m; G+ f& j) V
    如何用 readmdict.py 提取 mdx/mdd 中的数据
    + T9 n$ w, S. q1 X; C; L0 h2 Phttp://jingyan.baidu.com/article/95c9d20d47583bec4e756132.html

    点评

    I really appreciate it!  发表于 2016-7-11 14:22
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-11 16:22:53 | 显示全部楼层
    谢谢楼主无私分享
    ) _* y" B3 i$ s2 q* W( ^! _开心!

    该用户从未签到

     楼主| 发表于 2016-7-11 17:05:01 | 显示全部楼层
    Snowdax 发表于 2016-7-10 22:532 N2 [/ q9 q- Y) y' T( u7 U
    咦 我记得Source Editor有类似功能

    9 a/ y: M! D/ R0 j# ]. U3 DSource Editor  确实没有这个功能
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:07:34 来自手机 | 显示全部楼层
    qiuhao1112 发表于 2016-7-11 08:49
    " K. A. E, |9 c1 D2 n, l+ r* [; x脚本还需要修复
    8 {  C, r, ~3 O9 N
    非常感谢!热切期待!
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:09:29 来自手机 | 显示全部楼层
    vbnet 发表于 2016-7-11 12:49) c. b4 r# k# t, a5 {" W
    如何用 readmdict.py 提取 mdx/mdd 中的数据
    ( b% Z& i9 Q! x( `4 Qhttp://jingyan.baidu.com/article/95c9d20d47583bec4e7561 ...
    ! a) ^- {' ?  q8 ]* s# m1 f
    楼主的可以根据单词表提取所需内容。你给的链接中只能提取全部内容。6 \6 x$ Y6 x" D; Q- q

    0 }) g. {) m( y, |& f$ b; @对于部分人来说,楼主的按需提取功能还是很方便的。

    点评

    vb大所提供的链接只是在回应fnaviwwo1在3楼所提问的问题,并非要跟LZ的功能做比较  发表于 2016-7-12 10:07
  • TA的每日心情
    开心
    2019-6-27 08:03
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:50:36 | 显示全部楼层
    windows 10 不能用
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-12 08:58:15 | 显示全部楼层
    qiuhao1112 发表于 2016-7-11 17:05$ M" q/ |7 Q" r* b8 i# Q4 x
    Source Editor  确实没有这个功能
    4 I- v" {6 g' P8 w$ Q% Z
    其实是可以的,用custom 添加reference list即可,但该软件好像没有开源,不知道是怎么实现的
    ; C2 |. x' `% M* }2 b! P! I& O

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 10:21:44 | 显示全部楼层
    请问楼主没操作指南之类的,对我这样的傻鸟的挑战可不是一般小啊
    ( ?. G2 Y: `- F7 `% T6 G谢谢
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 10:24:43 | 显示全部楼层
    按Readme去操作了,但好像没得到什么东东。
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 11:29:20 | 显示全部楼层
    menglongma 发表于 2016-7-11 18:50
    $ Y) _) [5 E& w5 Z" m: N9 V% ewindows 10 不能用

    ! e  c3 O: ^. G+ z这就难怪了
    ' h7 k- h0 d7 K6 E' Z; ]谢谢分享
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2026-6-20 12:27 , Processed in 0.027531 second(s), 29 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表