掌上百科 - PDAWIKI

用户名  找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 758|回复: 1

[求助] 谁能解决我遇到的一个问题,我就发布一个抽取柯林斯的工具

[复制链接]

该用户从未签到

发表于 2017-11-29 15:57:46 | 显示全部楼层 |阅读模式
本帖最后由 priestpdawiki 于 2017-11-29 16:10 编辑 ( p. N1 P5 k4 H9 |7 `2 y  h% x
6 g6 q* w5 S1 q. p1 M) H: R9 M
我用 python 做了一个 从单词表txt中, 提取出 柯林斯 内容 的小脚本. 本来想发在这里供大家用着玩玩的, 但是遇到一个问题:
0 k+ @5 F; d9 |) L4 X7 Z: e# z2 o# y0 f
我在代码中, 导入了一个外链的 pickle腌制文件, 这个pickle文件中, 存放的就是 柯林斯的全部内容(我把金山和有道版合并了. 以金山优先, 金山版没有的单词, 才取自有道). 但并不保留原mdx的 html格式. 因为我处理成纯文本txt了, 因此我这个工具生成的结果, 不是在欧路词典中使用的, 而是可以在word中继续编辑的.
+ N! a% ^8 I( N, }+ m
( C5 o$ e4 N) U3 \- {  g但是, 我在用 pyinstaller模块来打包生成 exe可执行文件 时, 发现, 它并没有把我的 外链 pickle文件一起打包进去, 也就是说, 如果我之后改动了 pickle文件的名字, 则 之前生成的exe文件 也会失效. 找不到外链文件了.0 C( ^: Q' |: U' v4 L9 ]: d
7 E& _" E. U9 d4 a! S
我没有查到解决方法, 似乎人家打包 exe时, 不使用 pickle腌制数据的?  但这个问题导致我就算把 exe文件上传在本论坛, 其他人也无法使用.
8 t! N; j8 |7 U- U+ z. B  n& Q/ g9 L" E7 Y" u
所以如果有知道怎么解决的, 能告知方法. 之后, 我会提供这个exe上来.2 k) S' @1 w) m& f
& \6 G6 r  C4 K" Z! v+ T: @
----------------------------------
) g* K7 }+ h$ d; u+ g1 `( p3 H- ?! T" l- B
这个小脚本的功能, 可以作为背单词使用. 比如, 你提供一个单词表(考研也好, 托福也好, 或你自定义的生词表),  这个脚本会抽取出所有存在于柯林斯辞典中的单词内容 (不存在的单词当然就没有了).  并且每个单词的所有释义,只保留第一个例句.
3 _! _% D+ k5 ~9 \  |) u6 E- h$ k3 c
本论坛有高人提供了其他各种抽取单词的方法, 甚至直接从mdx中抽取单词, 不过我做的这个比较傻瓜, 只要你输入两个路径即可, 一个是单词表txt路径, 一个是抽取柯林斯后,保存到电脑上的txt路径.
! L% c. S: n! p0 U, P0 n/ Y/ F( K) ^- r$ S+ a
先截个图吧, dos窗口操作. 0 ?0 g7 \' k1 f% ~) e$ u( S
5 h$ i; J0 k2 Y, _( y, ?$ z6 I

9 ~( E2 j# t& ?( f  }, G

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2018-1-16 10:49:58 | 显示全部楼层
好东西,从Online上抽取吗?可否分享?
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2025-5-21 06:47 , Processed in 0.022346 second(s), 22 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表