掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 15885|回复: 269

[工具] 【2016.08.11 优化】Mdict词典DIY工具系列之一:词条内容提取利器,极速提取

  [复制链接]

该用户从未签到

发表于 2016-7-10 16:12:09 | 显示全部楼层 |阅读模式
本帖最后由 qiuhao1112 于 2016-8-11 20:15 编辑
- Z, |; U* c$ p9 p5 v: D4 v3 f: I1 ]1 b7 L
Mdict词典DIY工具系列之一:词条内容提取利器,极速提取
0 T. w% R3 S3 l$ s; R1 Q6 A" S( Y0 K: D* a, q  s, m
==============% p5 Z+ m2 q& a. c- z  ~
2016.08.11 优化:
$ k0 O$ {* ]- I6 R  @* p6 F
修改了程序,若原文本有多个相同的词条,则不再覆盖,保留对应文本。, |: N5 D" O$ X6 W

, U+ O% Q5 F, r改为百度云分享,便于更新。
( c8 n8 \8 F% Y, ]. S9 {$ T1 n- l- C8 d# h5 {0 e
==============
# f' m3 X( G, B# X1 r
* Z& Z; [- f: T$ G  S& q1 q9 l
- X9 h% c; z1 k7 z0 K
% p5 X  Q, [, G9 G' Q) X# a, @7 xMdict词典DIY工具系列:; J4 w/ L/ @% U
+ u" c% ]) K$ c5 d  j
Mdict词典DIY工具系列之一:词条内容提取利器 , J& }% A0 K: U- E( [# b! }! `
Mdict词典DIY工具系列之二:词条合并工具,二合一 ! q- o; K7 K: H  g
Mdict词典DIY工具系列之三:MDX文本内容提取解析工具
. M7 Y2 \$ l6 `5 H: A: k$ SMdict词典DIY工具系列之四:词条合并工具,N合一
3 E. v5 O! [/ t$ ]Mdict词典DIY工具系列之五:MDX文本内容 & 词条 去重工具
. m$ E7 a' P2 f! u  x8 |' c4 I' O, k. ~. u4 n) x

# t% L% ?- U+ x# Q7 [
% P+ J7 L( T7 W: ?; u4 ?6 G之前的程序报有病毒,已重新打包上传。
% w6 F* v. @' ], m4 p1 M7 p( Z+ j2 A/ U* \" f( v5 k

+ `2 ], V; x5 U1 @# y9 Z* H; V: P8 a/ {1 f& V+ \$ R+ N

) n( T& [, M+ C5 @# VExtractor from MDX by Wordlist v 2.0:* O* r4 r* ?; k% T7 |  J3 |
' L8 D+ m7 z1 Y- }# \

2 T6 l0 b9 I3 u
. U- o+ I) \: s5 _3 a8 |        使用方法:
2 H2 N! j. f9 a" Z6 z# m6 j% m  Q3 Z& B7 w" H& s: ~3 e$ K, D% s) M
       
8 ]( \! T# v& k) n* a6 f4 U6 N        提取词典内容的源码文件应为Mdict词典格式的文本(.txt)文件。& g0 L: J* u) X7 U, M

& ?' t; S4 l! E' j6 p        该程序无图形化界面,为方便使用,请把文本文件名改为阿拉伯数字或字母,方便文件名输入。# k) @6 V! p, ]. e
- j) h$ O- U' {" U+ X
        Input wordlist file name:  输入单词列表名,无需添加 .txt后缀;3 f  a5 I2 [# |% `. ?4 `! _0 t8 c& v
        Input source file name: 输入MDX格式的源码文件名,无需添加 .txt后缀;. k+ b2 v& F0 i. t6 O  G' @+ R' u) h
        1 FOR include, 0 FOR exclude:  选择1 include 模式,选择0 exclude 模式。
7 D+ h: h& B/ \* F% M3 I/ W
/ k6 ^0 i) x3 i) G$ n( b9 K6 _                                模式1: 提取包括该单词列表的内容
& x' l( j- w. J: Z' W% z6 e3 V8 v' P+ X                                模式2: 提取非包括该单词列表的内容
' |1 m) G- d) a8 Y9 Q* t. X  H; d; u6 j
===============================
! D+ u, o5 p  c- o7 D" S& ^1 w/ Z' a6 n# t
$ {! i; |2 Z+ R. f
链接:http://pan.baidu.com/s/1bpbYkwB 密码:55po
" d3 i6 d* @) P1 ^9 m

评分

1

查看全部评分

本帖被以下淘专辑推荐:

  • · 工具|主题: 8, 订阅: 5
  • TA的每日心情
    奋斗
    2022-11-19 13:01
  • 签到天数: 21 天

    [LV.4]偶尔看看III

    发表于 2016-11-28 12:14:05 | 显示全部楼层
    谢谢楼主分享,下载看下

    该用户从未签到

     楼主| 发表于 2016-7-12 11:02:38 来自手机 | 显示全部楼层
    Snowdax 发表于 2016-7-12 08:58
    . V" ~) P- ?' \( [9 `; E% i5 F3 X' d其实是可以的,用custom 添加reference list即可,但该软件好像没有开源,不知道是怎么实现的

    1 v: D" q! f( V应该是我以前没发现这个功能吧   而且sunsmile大的那个速度很快  应该是用Java或者C写的  这两个我都我不会    我的脚本思路也有问题
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-12 12:45:20 | 显示全部楼层
    qiuhao1112 发表于 2016-7-12 11:02& v& P0 I. E6 s
    应该是我以前没发现这个功能吧   而且sunsmile大的那个速度很快  应该是用Java或者C写的  这两个我都我不 ...
    $ {4 q/ y# p  f9 v7 c4 `
    因为我之前做词典用过这个功能,所有隐约有一些印象
    . l: ~% b1 Y' @python代码比较简洁,但运行速度确实不快
    0 F0 h6 A. C, Z3 f3 u1 V% F(其实我也是门外汉的

    该用户从未签到

     楼主| 发表于 2016-7-10 16:26:03 | 显示全部楼层
    本帖最后由 qiuhao1112 于 2016-8-7 15:09 编辑
    . t7 m( f  r( L7 b( E1 g' s) {3 @7 {! N; m& w. m! S
    打开大文件无压力。。

    该用户从未签到

    发表于 2016-7-10 16:33:17 | 显示全部楼层
    巨巨请教一下,读取mdx用的什么python库啊?
    ) A$ F2 |3 ?7 [+ }还有写mdx只有MDX Builder,有没有支持命令行的工具啊?

    该用户从未签到

    发表于 2016-7-10 16:51:40 | 显示全部楼层
    路过帮顶辛苦了

    该用户从未签到

    发表于 2016-7-10 18:51:50 | 显示全部楼层
    这不是很多人需要的工具吗?!

    该用户从未签到

    发表于 2016-7-10 21:47:30 来自手机 | 显示全部楼层
    真是雪中送炭呀
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-10 22:53:15 | 显示全部楼层
    咦 我记得Source Editor有类似功能
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-11 08:01:41 来自手机 | 显示全部楼层
    太好了!可以自己折腾词库啦!
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 08:43:48 来自手机 | 显示全部楼层
    楼主,我是linux用户。求原始Python脚本

    该用户从未签到

     楼主| 发表于 2016-7-11 08:49:00 | 显示全部楼层
    本帖最后由 qiuhao1112 于 2016-7-11 16:44 编辑 + c0 M8 k1 e! x- J) S0 H; B# n
    lmjiao 发表于 2016-7-11 08:435 W) m& Z5 s" v6 {5 q4 }
    楼主,我是linux用户。求原始Python脚本

    - v. Z, h( e, n* f8 p7 D3 u! n# H; l; P* `
    脚本还需要修复

    点评

    感觉可以用的dict先存一下数据,然后再提取。还有Python的thread在gil的条件下是针对IO阻塞的情况用的,这里好像没有必要。。。  发表于 2016-7-11 14:45
  • TA的每日心情
    无聊
    2020-11-6 22:08
  • 签到天数: 26 天

    [LV.4]偶尔看看III

    发表于 2016-7-11 10:08:34 | 显示全部楼层
    perfect exe~

    该用户从未签到

    发表于 2016-7-11 12:49:56 | 显示全部楼层
    fnaviwwo1 发表于 2016-7-10 16:33
    3 F. K) V) U- ]3 R/ W2 c6 y. a巨巨请教一下,读取mdx用的什么python库啊?) [% T8 i1 \# a! O) C( p0 k" M7 i
    还有写mdx只有MDX Builder,有没有支持命令行的工具啊?
    ! U" R( S, W+ ?, j6 J0 S
    如何用 readmdict.py 提取 mdx/mdd 中的数据
    5 w& _8 `( C! Vhttp://jingyan.baidu.com/article/95c9d20d47583bec4e756132.html

    点评

    I really appreciate it!  发表于 2016-7-11 14:22
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-11 16:22:53 | 显示全部楼层
    谢谢楼主无私分享
    5 K- c9 l% n! q/ v% a3 g开心!

    该用户从未签到

     楼主| 发表于 2016-7-11 17:05:01 | 显示全部楼层
    Snowdax 发表于 2016-7-10 22:53" h# w6 O2 \; D7 O5 O4 Z# F
    咦 我记得Source Editor有类似功能

    + v, K+ H* }7 v- T0 sSource Editor  确实没有这个功能
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:07:34 来自手机 | 显示全部楼层
    qiuhao1112 发表于 2016-7-11 08:49
    ! K9 q% g, `; @: x8 s0 W脚本还需要修复
    5 |; J5 I) B' N- O* ?- G
    非常感谢!热切期待!
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:09:29 来自手机 | 显示全部楼层
    vbnet 发表于 2016-7-11 12:49$ t" p6 {: U7 }5 _3 C
    如何用 readmdict.py 提取 mdx/mdd 中的数据
    4 L& V4 I. {3 k. S0 B) w9 xhttp://jingyan.baidu.com/article/95c9d20d47583bec4e7561 ...
    3 \7 Q7 X( ~3 k3 ]! f
    楼主的可以根据单词表提取所需内容。你给的链接中只能提取全部内容。7 ]! O+ @* C' u% D/ s4 _5 o

    ' p; h: ^- [- r: |对于部分人来说,楼主的按需提取功能还是很方便的。

    点评

    vb大所提供的链接只是在回应fnaviwwo1在3楼所提问的问题,并非要跟LZ的功能做比较  发表于 2016-7-12 10:07
  • TA的每日心情
    开心
    2019-6-27 08:03
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:50:36 | 显示全部楼层
    windows 10 不能用
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-12 08:58:15 | 显示全部楼层
    qiuhao1112 发表于 2016-7-11 17:05* ~6 z$ M" i0 l+ c  ^! q) K
    Source Editor  确实没有这个功能

    1 [# C8 n8 a8 D2 G2 M- X% J其实是可以的,用custom 添加reference list即可,但该软件好像没有开源,不知道是怎么实现的
    + e/ o/ G. Y+ K+ p# N! l9 U, ^$ }

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 10:21:44 | 显示全部楼层
    请问楼主没操作指南之类的,对我这样的傻鸟的挑战可不是一般小啊4 C/ g- l5 j  z" A3 i
    谢谢
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 10:24:43 | 显示全部楼层
    按Readme去操作了,但好像没得到什么东东。
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 11:29:20 | 显示全部楼层
    menglongma 发表于 2016-7-11 18:50
    1 t- L: c6 H1 t* ~" Cwindows 10 不能用

    & u8 u: x9 z# }7 ~2 Y这就难怪了5 v# E, r% C4 x+ o
    谢谢分享
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-19 03:24 , Processed in 0.081358 second(s), 13 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表