MdxScraper：提取MDX内容并输出为PDF、HTML或JPG

VimVim · 发表于 2024-1-15 20:11:46

本帖最后由 VimVim 于 2024-1-22 16:10 编辑

* 项目地址：https://github.com/VimWei/MdxScraper

## 简介

一句话：根据指定的词汇列表，从MDX字典提取内容并输出为PDF、HTML或JPG。

详情：MdxScraper 是在MdxConverter 基础上升级改造：

全面提升跨平台兼容性，包括wkhtmltopdf、mdx路径名等在跨平台中的多种写法。
支持同一个页面多次重复引用同一图片的情形（词典中的读音图标多次出现的情形很常见）。
增加对jpg、jpeg、gif等图片的支持，原程序只支持png图片。
兼容img标签的各种写法，原程序只支持一种，因此也就兼容各种词典情形。
兼容无CSS文件的词典。
增加PDF输出时排版的多个常见配置选项，让用户更加自由定制。
将mdict-query直接放在同名子目录下，避免繁琐安装。
以当前时间命名文件名，避免多次输出时覆盖原有的文件。$ z( a* R: s" d; G* m

## 下载

游客，如果您要查看本帖隐藏内容请回复

VimVim · 发表于 2024-4-17 17:41:48

本帖最后由 VimVim 于 2024-4-17 17:48 编辑

VimVim 发表于 2024-2-4 23:12
) L; W3 ~0 l% {! d" S6 z& ^具体看readme。简单的说：7 y1 u, b8 u0 j* \! U

5 ^7 N* ~" J1 M! m4 p1、安装python和 ##依赖库及程序3 Y1 U F+ @% u: _+ g
2、执行命令：python MdxScraper.py "mdx\某某词典.mdx" input.txt output.pdf

已经全面更新了程序，通过配置的方式使用，

配置参数：settings.py
运行程序：python MdxScraper.py
3 y8 h* ?" G7 r1 s% _9 W/ Z( y

更简单明了，具体看官网发布页面的说明。

VimVim · 发表于 2024-2-4 23:12:53

本帖最后由 VimVim 于 2024-4-17 17:45 编辑

zljoutlook 发表于 2024-2-4 20:01 J4 }; v( Q% i/ {
下载后只有五个文件，没有执行程序，如何使用请赐教

具体看readme。简单的说：

1、安装python和 ##依赖库及程序
2、执行命令：python MdxScraper.py "mdx\某某词典.mdx" input.txt output.pdf

如果还有疑问，请自行学习python基础知识。

Update：程序已升级，通过配置的方式使用，而非命令行，使用更简单，具体看发布页说明。

每天吃肉 · 发表于 2024-1-19 07:38:57

楼主，我的宽带上不了外网，有没有百度阿里网盘这种资源啊。谢谢啦

yfz48516 · 发表于 2024-1-15 21:03:34

感谢楼主分享。

shuwushimang · 发表于 2024-1-15 21:06:38

非常感谢

RickVincent · 发表于 2024-1-16 00:07:31

Thanks for sharing...

ywj333 · 发表于 2024-1-16 00:28:37

谢谢分享

saw2021 · 发表于 2024-1-16 05:39:43

感谢楼主分享

bigriver · 发表于 2024-1-16 08:11:24

好东西，以后可能用得上。谢谢。

阶梯 · 发表于 2024-1-16 09:08:50

感谢楼主分享

sg1968321 · 发表于 2024-1-16 10:02:10

谢谢分享。

Shiny2020 · 发表于 2024-1-16 12:34:19

谢谢分享！

jazzmood · 发表于 2024-1-17 00:17:01

谢谢楼主分享！

人在上海 · 发表于 2024-1-17 09:05:53

Thanks for sharing...

每天吃肉 · 发表于 2024-1-19 07:36:28

谢谢楼主大哥

csmpaul · 发表于 2024-1-19 08:13:24

感谢楼主的分享

spolinar · 发表于 2024-1-20 13:30:45

看来不错，谢谢分享。

shinbade · 发表于 2024-1-20 19:02:36

这个有用处。。。。。

zljoutlook · 发表于 2024-1-21 11:51:38

感谢楼主分享！

shinbade · 发表于 2024-1-21 14:56:55

链接打不开啊，怎么回事呢。

yuqinghuaz1 · 发表于 2024-1-21 22:41:03

本帖最后由 yuqinghuaz1 于 2024-1-21 22:43 编辑

谢谢分享这个可以有但是无法下载

luzaihefan918 · 发表于 2024-1-22 11:43:51

Thanks for sharing...

shinbade · 发表于 2024-1-22 15:34:32

OK，翻过去，能下载。

阿涛涛 · 发表于 2024-1-22 20:18:03

感谢楼主的热心奉献

wiray · 发表于 2024-1-22 22:59:52

感谢分享

文曲星 · 发表于 2024-1-23 10:04:10

楼主辛苦

用户名		自动登录	找回密码
密码			免费注册

[工具] MdxScraper：提取MDX内容并输出为PDF、HTML或JPG

评分

点评

点评

点评