VimVim 发表于 2024-1-15 20:11:46

MdxScraper:提取MDX内容并输出为PDF、HTML或JPG

本帖最后由 VimVim 于 2024-1-22 16:10 编辑

* 项目地址:https://github.com/VimWei/MdxScraper

## 简介

一句话:根据指定的词汇列表,从MDX字典提取内容并输出为PDF、HTML或JPG。
详情:MdxScraper 是在MdxConverter 基础上升级改造:

[*]全面提升跨平台兼容性,包括wkhtmltopdf、mdx路径名等在跨平台中的多种写法。
[*]支持同一个页面多次重复引用同一图片的情形(词典中的读音图标多次出现的情形很常见)。
[*]增加对jpg、jpeg、gif等图片的支持,原程序只支持png图片。
[*]兼容img标签的各种写法,原程序只支持一种,因此也就兼容各种词典情形。
[*]兼容无CSS文件的词典。
[*]增加PDF输出时排版的多个常见配置选项,让用户更加自由定制。
[*]将mdict-query直接放在同名子目录下,避免繁琐安装。
[*]以当前时间命名文件名,避免多次输出时覆盖原有的文件。


## 下载

**** Hidden Message *****



VimVim 发表于 2024-4-17 17:41:48

本帖最后由 VimVim 于 2024-4-17 17:48 编辑

VimVim 发表于 2024-2-4 23:12
具体看readme。简单的说:

1、安装python和 ##依赖库及程序
2、执行命令:python MdxScraper.py "mdx\某某词典.mdx" input.txt output.pdf


已经全面更新了程序,通过配置的方式使用,



[*]配置参数:settings.py
[*]运行程序:python MdxScraper.py


更简单明了,具体看官网发布页面的说明。

VimVim 发表于 2024-2-4 23:12:53

本帖最后由 VimVim 于 2024-4-17 17:45 编辑

zljoutlook 发表于 2024-2-4 20:01
下载后只有五个文件,没有执行程序,如何使用请赐教
具体看readme。简单的说:

1、安装python和 ##依赖库及程序
2、执行命令:python MdxScraper.py "mdx\某某词典.mdx" input.txt output.pdf

如果还有疑问,请自行学习python基础知识。


Update:程序已升级,通过配置的方式使用,而非命令行,使用更简单,具体看发布页说明。

每天吃肉 发表于 2024-1-19 07:38:57

楼主,我的宽带上不了外网,有没有百度阿里网盘这种资源啊。谢谢啦

yfz48516 发表于 2024-1-15 21:03:34

    感谢楼主分享。

shuwushimang 发表于 2024-1-15 21:06:38

非常感谢

RickVincent 发表于 2024-1-16 00:07:31

Thanks for sharing...

ywj333 发表于 2024-1-16 00:28:37

谢谢分享

saw2021 发表于 2024-1-16 05:39:43

感谢楼主分享

bigriver 发表于 2024-1-16 08:11:24

好东西,以后可能用得上。谢谢。

阶梯 发表于 2024-1-16 09:08:50

感谢楼主分享

sg1968321 发表于 2024-1-16 10:02:10

谢谢分享。

Shiny2020 发表于 2024-1-16 12:34:19

谢谢分享!

jazzmood 发表于 2024-1-17 00:17:01

谢谢楼主分享!

人在上海 发表于 2024-1-17 09:05:53

Thanks for sharing...

每天吃肉 发表于 2024-1-19 07:36:28

谢谢楼主大哥

csmpaul 发表于 2024-1-19 08:13:24

感谢楼主的分享

spolinar 发表于 2024-1-20 13:30:45

看来不错,谢谢分享。

shinbade 发表于 2024-1-20 19:02:36

这个有用处。。。。。

zljoutlook 发表于 2024-1-21 11:51:38

感谢楼主分享!

shinbade 发表于 2024-1-21 14:56:55

链接打不开啊,怎么回事呢。

yuqinghuaz1 发表于 2024-1-21 22:41:03

本帖最后由 yuqinghuaz1 于 2024-1-21 22:43 编辑

谢谢分享   这个可以有   但是无法下载

luzaihefan918 发表于 2024-1-22 11:43:51


Thanks for sharing...

shinbade 发表于 2024-1-22 15:34:32

OK,翻过去,能下载。

阿涛涛 发表于 2024-1-22 20:18:03

感谢楼主的热心奉献

wiray 发表于 2024-1-22 22:59:52

感谢分享

文曲星 发表于 2024-1-23 10:04:10

楼主辛苦
页: [1] 2
查看完整版本: MdxScraper:提取MDX内容并输出为PDF、HTML或JPG