掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 19606|回复: 269

[工具] 【2016.08.11 优化】Mdict词典DIY工具系列之一:词条内容提取利器,极速提取

  [复制链接]

该用户从未签到

发表于 2016-7-10 16:12:09 | 显示全部楼层 |阅读模式
本帖最后由 qiuhao1112 于 2016-8-11 20:15 编辑
2 P* r# i0 s' M: q% G" e' j
  G1 v% x% V$ ?* uMdict词典DIY工具系列之一:词条内容提取利器,极速提取
2 ^& T+ s4 R- a" |+ e
- q/ a) a4 T/ N==============
. R8 Z9 R# l4 f2 ?# |4 V2016.08.11 优化:

7 [- @/ T0 d. y修改了程序,若原文本有多个相同的词条,则不再覆盖,保留对应文本。
: T% {! t) B, ~& p$ {; H! A1 Z6 x9 p4 j9 e
改为百度云分享,便于更新。
, ]! T2 L, I  Z6 f3 q! M5 z! q! w6 \! B1 E; ~
==============
4 ?4 y/ @7 e  }' _( ~% N; L$ j' k1 _$ f; S2 C1 g7 A+ R) u

5 k! J& p8 t0 M4 ]2 g& d. S0 C, `& E- U' A
Mdict词典DIY工具系列:
2 `- h, M. w1 r0 G0 V5 d+ I0 p  P" N3 X4 [
Mdict词典DIY工具系列之一:词条内容提取利器 ' R# Q+ q3 g$ H1 `
Mdict词典DIY工具系列之二:词条合并工具,二合一
$ z) _1 w: e0 n1 nMdict词典DIY工具系列之三:MDX文本内容提取解析工具5 n6 V+ C: {2 [
Mdict词典DIY工具系列之四:词条合并工具,N合一7 D6 Q% W# p( D
Mdict词典DIY工具系列之五:MDX文本内容 & 词条 去重工具
( Q' m- O) g2 [+ b
" K8 b, t- ~5 r: H/ I
" S: m% e6 E7 a( y! P5 c. a2 x

- g5 k3 Y" C, l之前的程序报有病毒,已重新打包上传。
. X5 A( p6 o) X0 W; J" l7 y; K% c- m" C9 ^3 m
( V( ^1 h( z3 d$ |: U8 c
  L! x% S+ L" i9 C' R: w( q# {

( e, u. }" i. g1 c( W( KExtractor from MDX by Wordlist v 2.0:: V5 C6 S4 C# b8 x' y8 C
8 O( V1 s) _8 L% I
3 H6 X5 g+ c4 _& z
0 l" ?, h8 p- \" @
        使用方法:
. n) ]+ U) X, ~: [# P0 y$ C+ ~" Z
' r) G5 x% ?! ]- }" p       
% V) H# N* Z/ m+ w        提取词典内容的源码文件应为Mdict词典格式的文本(.txt)文件。8 z. P1 m* s; @
& T: L- G1 s6 y
        该程序无图形化界面,为方便使用,请把文本文件名改为阿拉伯数字或字母,方便文件名输入。
) }2 h! U  b* s1 ]
" G- L, |* W4 r) n! v+ J7 l: v        Input wordlist file name:  输入单词列表名,无需添加 .txt后缀;
+ I% }. o8 F$ c# A; o) M( E        Input source file name: 输入MDX格式的源码文件名,无需添加 .txt后缀;5 p  [# \4 e$ A; C
        1 FOR include, 0 FOR exclude:  选择1 include 模式,选择0 exclude 模式。
" U7 w. e6 {0 m; d' }! W# N; O, j( b; B. y0 w( {" C. P& l. z
                                模式1: 提取包括该单词列表的内容8 z' B# r" N" }# C
                                模式2: 提取非包括该单词列表的内容- N2 t9 C  w4 Z) T# q

" b$ A4 v4 u; X% V' C: R===============================) ^9 @; I" _( F, `* k' d+ t. t

8 S5 j# c! g/ z9 ~2 v9 C: U; N8 x, o
链接:http://pan.baidu.com/s/1bpbYkwB 密码:55po. d$ o% v. S8 k  v* P! l$ B

评分

1

查看全部评分

本帖被以下淘专辑推荐:

  • · 工具|主题: 8, 订阅: 5
  • TA的每日心情
    奋斗
    2022-11-19 13:01
  • 签到天数: 21 天

    [LV.4]偶尔看看III

    发表于 2016-11-28 12:14:05 | 显示全部楼层
    谢谢楼主分享,下载看下

    该用户从未签到

     楼主| 发表于 2016-7-12 11:02:38 来自手机 | 显示全部楼层
    Snowdax 发表于 2016-7-12 08:58' L; v- ^: K* q$ X5 {4 a8 i6 M
    其实是可以的,用custom 添加reference list即可,但该软件好像没有开源,不知道是怎么实现的

    0 b' \, @) m3 E0 j* Y: F& C应该是我以前没发现这个功能吧   而且sunsmile大的那个速度很快  应该是用Java或者C写的  这两个我都我不会    我的脚本思路也有问题
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-12 12:45:20 | 显示全部楼层
    qiuhao1112 发表于 2016-7-12 11:02* H# J8 R9 b( _6 M! j
    应该是我以前没发现这个功能吧   而且sunsmile大的那个速度很快  应该是用Java或者C写的  这两个我都我不 ...
    0 [( N2 ~" @- b  f" }
    因为我之前做词典用过这个功能,所有隐约有一些印象
    $ w9 q/ H( c$ W0 C; ?python代码比较简洁,但运行速度确实不快  z# t( s0 s! m1 i0 X4 q' }
    (其实我也是门外汉的

    该用户从未签到

     楼主| 发表于 2016-7-10 16:26:03 | 显示全部楼层
    本帖最后由 qiuhao1112 于 2016-8-7 15:09 编辑
    + g8 g/ |7 e2 i
    ) N7 X# R4 D4 h' m打开大文件无压力。。

    该用户从未签到

    发表于 2016-7-10 16:33:17 | 显示全部楼层
    巨巨请教一下,读取mdx用的什么python库啊?2 t: I' Q2 y+ D: g- c& k( o
    还有写mdx只有MDX Builder,有没有支持命令行的工具啊?

    该用户从未签到

    发表于 2016-7-10 16:51:40 | 显示全部楼层
    路过帮顶辛苦了

    该用户从未签到

    发表于 2016-7-10 18:51:50 | 显示全部楼层
    这不是很多人需要的工具吗?!

    该用户从未签到

    发表于 2016-7-10 21:47:30 来自手机 | 显示全部楼层
    真是雪中送炭呀
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-10 22:53:15 | 显示全部楼层
    咦 我记得Source Editor有类似功能
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-11 08:01:41 来自手机 | 显示全部楼层
    太好了!可以自己折腾词库啦!
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 08:43:48 来自手机 | 显示全部楼层
    楼主,我是linux用户。求原始Python脚本

    该用户从未签到

     楼主| 发表于 2016-7-11 08:49:00 | 显示全部楼层
    本帖最后由 qiuhao1112 于 2016-7-11 16:44 编辑 ( A& g$ i$ n. E3 h
    lmjiao 发表于 2016-7-11 08:43
    9 P2 V, O; N! ~8 ^楼主,我是linux用户。求原始Python脚本
    . T3 ~, k; ~  v* S/ b" r, ?
    - G( D6 p& H1 ?: Q: d- N
    脚本还需要修复

    点评

    感觉可以用的dict先存一下数据,然后再提取。还有Python的thread在gil的条件下是针对IO阻塞的情况用的,这里好像没有必要。。。  发表于 2016-7-11 14:45
  • TA的每日心情
    无聊
    2020-11-6 22:08
  • 签到天数: 26 天

    [LV.4]偶尔看看III

    发表于 2016-7-11 10:08:34 | 显示全部楼层
    perfect exe~

    该用户从未签到

    发表于 2016-7-11 12:49:56 | 显示全部楼层
    fnaviwwo1 发表于 2016-7-10 16:336 a0 D' y% I0 Q. j$ o# M) b
    巨巨请教一下,读取mdx用的什么python库啊?' U$ d7 V  j6 P' F
    还有写mdx只有MDX Builder,有没有支持命令行的工具啊?
    - K2 s2 _; L5 r# Z8 n3 L7 O
    如何用 readmdict.py 提取 mdx/mdd 中的数据
    7 }. w' J& u9 chttp://jingyan.baidu.com/article/95c9d20d47583bec4e756132.html

    点评

    I really appreciate it!  发表于 2016-7-11 14:22
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-11 16:22:53 | 显示全部楼层
    谢谢楼主无私分享
    - o- Z! f+ I6 B! J9 y! D开心!

    该用户从未签到

     楼主| 发表于 2016-7-11 17:05:01 | 显示全部楼层
    Snowdax 发表于 2016-7-10 22:53
    7 |2 q; m- r7 \8 t咦 我记得Source Editor有类似功能

    2 O: H6 i+ b# `. WSource Editor  确实没有这个功能
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:07:34 来自手机 | 显示全部楼层
    qiuhao1112 发表于 2016-7-11 08:49
    $ f0 Q3 Q) T9 l; `% r- d7 k脚本还需要修复
    , H1 v: g$ N1 U  g/ K( Y+ k5 }( s
    非常感谢!热切期待!
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:09:29 来自手机 | 显示全部楼层
    vbnet 发表于 2016-7-11 12:49
    1 d/ E+ \2 S5 V  T/ M. s& ^如何用 readmdict.py 提取 mdx/mdd 中的数据
    ; e) W. ]. }) g2 w) I! [http://jingyan.baidu.com/article/95c9d20d47583bec4e7561 ...
    # S* {) ?7 U; T. M& j* G
    楼主的可以根据单词表提取所需内容。你给的链接中只能提取全部内容。
    5 ~( g. Q: z4 U' Y8 q; Z5 t, t" t8 R; {* Q( ^$ _; |! A1 Q4 E+ Z
    对于部分人来说,楼主的按需提取功能还是很方便的。

    点评

    vb大所提供的链接只是在回应fnaviwwo1在3楼所提问的问题,并非要跟LZ的功能做比较  发表于 2016-7-12 10:07
  • TA的每日心情
    开心
    2019-6-27 08:03
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:50:36 | 显示全部楼层
    windows 10 不能用
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-12 08:58:15 | 显示全部楼层
    qiuhao1112 发表于 2016-7-11 17:052 [, Q! R5 y5 t5 y' u- I
    Source Editor  确实没有这个功能
    # {! L; O& Q7 [
    其实是可以的,用custom 添加reference list即可,但该软件好像没有开源,不知道是怎么实现的
    7 @, Q2 ^) l1 A

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 10:21:44 | 显示全部楼层
    请问楼主没操作指南之类的,对我这样的傻鸟的挑战可不是一般小啊. R- y: ]1 q. }- e  I4 ]
    谢谢
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 10:24:43 | 显示全部楼层
    按Readme去操作了,但好像没得到什么东东。
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 11:29:20 | 显示全部楼层
    menglongma 发表于 2016-7-11 18:50
    " M5 Y+ U# D4 {! b( Pwindows 10 不能用
    . Y" k9 e" }; j- v5 k: a% Z5 q
    这就难怪了$ C) i; n7 `; [% o  {. U
    谢谢分享
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-13 13:50 , Processed in 0.025625 second(s), 28 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表