MdxScraper:提取MDX内容并输出为PDF、HTML或JPG
本帖最后由 VimVim 于 2024-1-22 16:10 编辑* 项目地址:https://github.com/VimWei/MdxScraper
## 简介
一句话:根据指定的词汇列表,从MDX字典提取内容并输出为PDF、HTML或JPG。
详情:MdxScraper 是在MdxConverter 基础上升级改造:
[*]全面提升跨平台兼容性,包括wkhtmltopdf、mdx路径名等在跨平台中的多种写法。
[*]支持同一个页面多次重复引用同一图片的情形(词典中的读音图标多次出现的情形很常见)。
[*]增加对jpg、jpeg、gif等图片的支持,原程序只支持png图片。
[*]兼容img标签的各种写法,原程序只支持一种,因此也就兼容各种词典情形。
[*]兼容无CSS文件的词典。
[*]增加PDF输出时排版的多个常见配置选项,让用户更加自由定制。
[*]将mdict-query直接放在同名子目录下,避免繁琐安装。
[*]以当前时间命名文件名,避免多次输出时覆盖原有的文件。
## 下载
**** Hidden Message *****
本帖最后由 VimVim 于 2024-4-17 17:48 编辑
VimVim 发表于 2024-2-4 23:12
具体看readme。简单的说:
1、安装python和 ##依赖库及程序
2、执行命令:python MdxScraper.py "mdx\某某词典.mdx" input.txt output.pdf
已经全面更新了程序,通过配置的方式使用,
[*]配置参数:settings.py
[*]运行程序:python MdxScraper.py
更简单明了,具体看官网发布页面的说明。
本帖最后由 VimVim 于 2024-4-17 17:45 编辑
zljoutlook 发表于 2024-2-4 20:01
下载后只有五个文件,没有执行程序,如何使用请赐教
具体看readme。简单的说:
1、安装python和 ##依赖库及程序
2、执行命令:python MdxScraper.py "mdx\某某词典.mdx" input.txt output.pdf
如果还有疑问,请自行学习python基础知识。
Update:程序已升级,通过配置的方式使用,而非命令行,使用更简单,具体看发布页说明。 楼主,我的宽带上不了外网,有没有百度阿里网盘这种资源啊。谢谢啦 感谢楼主分享。 非常感谢 Thanks for sharing... 谢谢分享 感谢楼主分享 好东西,以后可能用得上。谢谢。 感谢楼主分享 谢谢分享。 谢谢分享! 谢谢楼主分享! Thanks for sharing... 谢谢楼主大哥 感谢楼主的分享 看来不错,谢谢分享。 这个有用处。。。。。 感谢楼主分享! 链接打不开啊,怎么回事呢。 本帖最后由 yuqinghuaz1 于 2024-1-21 22:43 编辑
谢谢分享 这个可以有 但是无法下载
Thanks for sharing... OK,翻过去,能下载。 感谢楼主的热心奉献 感谢分享 楼主辛苦
页:
[1]
2