掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 601|回复: 1

[求助] 谁能解决我遇到的一个问题,我就发布一个抽取柯林斯的工具

[复制链接]

该用户从未签到

发表于 2017-11-29 15:57:46 | 显示全部楼层 |阅读模式
本帖最后由 priestpdawiki 于 2017-11-29 16:10 编辑 ! f* |4 o) Y% F8 S7 ?4 k& z: H

9 p& D  c5 t9 I  W6 D3 J我用 python 做了一个 从单词表txt中, 提取出 柯林斯 内容 的小脚本. 本来想发在这里供大家用着玩玩的, 但是遇到一个问题:
% K, X- ~9 v$ l- e& x* w5 F# H) U2 |  l/ K( R/ v0 k
我在代码中, 导入了一个外链的 pickle腌制文件, 这个pickle文件中, 存放的就是 柯林斯的全部内容(我把金山和有道版合并了. 以金山优先, 金山版没有的单词, 才取自有道). 但并不保留原mdx的 html格式. 因为我处理成纯文本txt了, 因此我这个工具生成的结果, 不是在欧路词典中使用的, 而是可以在word中继续编辑的.- h( Q1 ?/ {$ P1 b

+ T6 P5 B) p; M1 q$ @但是, 我在用 pyinstaller模块来打包生成 exe可执行文件 时, 发现, 它并没有把我的 外链 pickle文件一起打包进去, 也就是说, 如果我之后改动了 pickle文件的名字, 则 之前生成的exe文件 也会失效. 找不到外链文件了.- H  Q$ G+ j- j! M! a) B3 _' U
1 C$ f! c! N. L) T2 P
我没有查到解决方法, 似乎人家打包 exe时, 不使用 pickle腌制数据的?  但这个问题导致我就算把 exe文件上传在本论坛, 其他人也无法使用.9 W+ v" d& u* f4 ]% r) b
1 o8 q- X3 }. ^# }2 O
所以如果有知道怎么解决的, 能告知方法. 之后, 我会提供这个exe上来.
/ i/ Z* P, U# I) i% M
1 ^* A/ A! M5 h----------------------------------) m3 w; E$ X( Z. }9 S8 `- C' h
% p. F) T. k0 [0 s" C  f
这个小脚本的功能, 可以作为背单词使用. 比如, 你提供一个单词表(考研也好, 托福也好, 或你自定义的生词表),  这个脚本会抽取出所有存在于柯林斯辞典中的单词内容 (不存在的单词当然就没有了).  并且每个单词的所有释义,只保留第一个例句.
# N3 @2 c$ ?# G* j
5 H, E- z0 L) w% Z' D本论坛有高人提供了其他各种抽取单词的方法, 甚至直接从mdx中抽取单词, 不过我做的这个比较傻瓜, 只要你输入两个路径即可, 一个是单词表txt路径, 一个是抽取柯林斯后,保存到电脑上的txt路径.) X$ g1 o5 }3 V7 R
0 g8 r$ Q: z; V6 T0 f& ]% o
先截个图吧, dos窗口操作.
: z* Q3 `, ^, R$ B9 r
2 I4 \3 Z' Y- r0 j; x' m/ r* Z) I6 a

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2018-1-16 10:49:58 | 显示全部楼层
好东西,从Online上抽取吗?可否分享?
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2024-4-16 17:38 , Processed in 0.038751 second(s), 10 queries , MemCache On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表