Mdict词典DIY工具系列之三:MDX文本内容提取解析工具
本帖最后由 qiuhao1112 于 2016-8-9 21:35 编辑Mdict词典DIY工具系列之三:MDX文本内容提取解析工具
基于html网页解析,专用于MDX文本解析并自动生成MDX格式文本,生成的文件可直接压缩打包成词典;
此工具可用来提取词典内容中的特定内容并,比如短语提取,音标提取等一切你想提取的内容。
用法:
比如下面这个网页标签:
<div class="explanation_item" id="d1234">
标签名为div
属性 有 class 和 id (还可能有别的属性)
其属性对应的值:class的是explanation_item ,id 的是d1234;
若想提取这个标签的内容:
需要输入三个值:div,class,explanation_item
或者:div,id,d1234
还有可能只有标签名,比如<body>这个标签,那么在(tag_name)输入框输入:body,其余不两项不用输入,直接回车即可
输入方法:
Input source file name:(你的MDX文本文件名)
Input tag-name:div
Input tag-attribute:class
Input attribute-value:explanation_item
或
Input source file name:(你的MDX文本文件名)
Input tag-name:div
Input tag-attribute:id
Input attribute-value:d1234
如果没有属性,比如body
Input source file name:(你的MDX文本文件名)
Input tag-name:body
Input tag-attribute:(不输入,回车跳过)
Input attribute-value:(不输入,回车跳过)
OK。。。。
由于是逐个解析html, 所以速度不是那么快,但使用足够简便,很方便。
谢谢分享 这是偶需要的工具,qiuhao1112老大 I love you 下载回帖,回头慢慢学习怎么用,谢谢楼主无私分享 谢谢楼主的分享!这个绝对要顶!!! 回头慢慢学习怎么用,谢谢楼主无私分享! dddddddddddddddd 谢谢楼主无私分享! 谢谢楼主 谢谢,这是MDICT的五个工具! 辛苦了! 神器啊 多多益善 下载解压显示 文件错误 求教:如果是要提取词典里面的例句的话,该如何用这个软件提取呢?谢谢 自己学习试试下,非常好 本帖最后由 lemonlab 于 2020-2-9 10:32 编辑
支持参数式命令行吗带空格类名怎么办
好的东西
页:
[1]