|
本帖最后由 qiuhao1112 于 2016-8-9 21:35 编辑 : D) O" m2 h. Q& ^0 T/ l- @! w+ m1 ~
0 N3 s8 e- E6 S# j& qMdict词典DIY工具系列之三:MDX文本内容提取解析工具# j/ b5 b% s- Y# b9 s6 l- B
; |+ S2 j3 z* N9 ~) [0 S( T7 p4 M/ L
1 o! ~* @* }2 O; m; D6 o
: G, z4 v. R$ C5 H# ]. w基于html网页解析,专用于MDX文本解析并自动生成MDX格式文本,生成的文件可直接压缩打包成词典;
& f2 y4 _4 C& N( F: s/ q0 G此工具可用来提取词典内容中的特定内容并,比如短语提取,音标提取等一切你想提取的内容。) Y2 `9 L) ^7 D# i
9 E: C% Z2 b* P; S
8 X0 [, G, |, p& I$ f# |4 z用法:1 l7 f& W, n; E$ t
/ r7 {' q5 e: V: S* x; A, w
比如下面这个网页标签:! M9 Y5 W& n, m5 i* C) X) t9 e1 k
( O# L @( }; w7 d* j, G
<div class="explanation_item" id="d1234">8 \0 z! D: R/ v/ h
5 H2 {7 K' m& w: ?# c
! T w, o6 q/ I! |
标签名为 div. R, c/ u! [3 I
属性 有 class 和 id (还可能有别的属性)# L6 Y3 `; C- M- h' z
其属性对应的值:class的是explanation_item , id 的是d1234;
$ Y' r- D0 D H, p, b) J- t7 ^2 X+ M% T% H) Z5 ]/ G$ k# s7 r0 g
/ Y, G: I2 l {3 {7 P9 s1 g若想提取这个标签的内容:
% b- b7 ?5 n2 u) J# O
! j. m4 W! W& H7 |! |需要输入三个值:div,class,explanation_item
7 [' d2 q: @, W6 S' T 或者:div,id,d1234 5 I0 W y0 U/ \& R+ B+ r/ S% O$ L6 H, h
% p, N$ L+ M$ d4 v0 ?' h还有可能只有标签名,比如<body>这个标签,那么在(tag_name)输入框输入:body,其余不两项不用输入,直接回车即可
/ K1 m! k {7 `! n0 e" {. Q5 S( J4 I! N
_# a) K. |3 e& P* `$ e0 p
6 Z8 h- x: k8 {9 {" N- W6 v输入方法:/ S; e4 m4 @' N4 M1 J6 W3 [% ~
) e% t8 w- d' U
Input source file name:(你的MDX文本文件名)
6 ^ N0 q# }" ]# }) w# n/ c+ g Input tag-name:div
( W0 u+ W& a# @9 K9 R9 {- B" d% r Input tag-attribute:class5 F: c$ M. ]: t2 }
Input attribute-value:explanation_item
1 V4 O- F7 k5 b1 ]- ]. h- M, w+ z! x j$ [: R& v0 F; O- [/ r+ p
或; |3 F. J) m& W& t! z+ t+ r, C
Input source file name:(你的MDX文本文件名)1 }4 k; X$ Y8 h6 \! ?
Input tag-name:div
% }) R. f* Q$ M8 c& C: j) J Input tag-attribute:id* N4 S3 { g& w( [
Input attribute-value:d1234/ C& e+ Q! X; S& {& \ b! D" ?+ U9 L
% u* H9 D ]) a" x, N# L1 O! y
如果没有属性,比如body
3 L# O. o0 b; j0 N: ?0 Z
- f: e3 X8 [6 _' p4 _! L0 c4 b Input source file name:(你的MDX文本文件名)
0 k; y3 P& s" Y n+ |9 L+ E" A9 Z Input tag-name:body
7 j0 Z: @( C6 a4 b$ u Input tag-attribute:(不输入,回车跳过), L, D! i2 \* N% N
Input attribute-value:(不输入,回车跳过)
) Q1 V( _2 {( G) {" b* @% z" w+ F
" L0 s- X0 e! s+ E& o4 q1 B+ o OK。。。。$ r% I& ]& r+ l2 j! O
0 I; C D9 o6 ^, r* F" X' J* }" @. [) ]
3 P- ]3 h X! x: Q( r; f1 T4 |) c8 G' T
由于是逐个解析html, 所以速度不是那么快,但使用足够简便,很方便。5 J) P( x' U3 i1 s
# C; y! V2 h$ Q! L
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
本帖被以下淘专辑推荐:
- · 工具|主题: 8, 订阅: 5
- · 其他资料|主题: 24, 订阅: 1
|