TA的每日心情 | 奋斗 2019-10-11 13:52 |
---|
签到天数: 142 天 [LV.7]常住居民III
|
本帖最后由 Snowdax 于 2018-4-6 23:00 编辑
2 z/ k. ^5 s; S! n; B; B- _
5 {) p g$ I6 a- y6 j已在 Github 上发布 A; |" S6 E& T$ j* p
https://github.com/Snowdax/customiseMdxFromList e- k1 Z9 Y6 x
& _8 [+ y8 B, `
readme 链接复制到论坛已失效,烦请移步 Github 阅读。
7 f& W& V; z0 K* z$ I
& A1 [3 l* E N1 O. x欢迎打赏! https://snowdax.github.io/buyMeACupOfSoyMilk/
8 Y- | w5 @% z5 ^7 J) c
" ~9 K7 V4 K1 d' y: l: y% fcustomiseMdxFromList
2 H: `0 U" e# o$ h5 z5 T" LCOCA5000.txt
0 A6 q# _0 @5 J& l2 _6 p% BCOCA5000.txt 储存了 https://www.wordfrequency.info/free.asp?s=y 页面上的 COCA5000 词汇表,每个单词一行# A0 g) r- D2 f. y% q l, b
9 j7 r V# f+ e0 w( o
COCA5000_list.py
+ p; ^, d0 ~- o; ACOCA5000_list.py 将上面的 txt 文件转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量,该 .py 文件可作为模块导入其他 Python 程序。这个文件是由 line2list.py 生成的。
; z5 N8 Y0 m# ^
u! u3 G {2 {' `line2list.py1 B; k, ` P2 \6 s1 m ~9 X' k+ F
输入:文件名.txt& g: s/ }) ^- a9 S
输出:文件名_list.txt
# [: [& Q# T9 R+ ~功能:将每行的内容转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量。
" I5 R4 i v4 _. m/ \# J* B i, ?9 V9 _0 _7 y8 C
customiseMdxFromList.py
' t9 C; V0 f4 ]9 A( P首先将所需词库的 .mdx 文件在 GetDict.exe 中转换为 MDX 源文件,如下图所示:3 @ B* o8 n! N* w
6 e0 J& h. z0 U& z% w# M+ k
M `9 J+ V$ x1 {; i生成的 .txt 类型的MDX 源文件,应该是一行词头,一行释义,一行 </>,如下图所示:+ [+ h. K* a L% j. B) N
- t5 O) v8 e" l2 J, O K% ~+ X9 V& h0 o# p
接下来,就可以使用 customiseMdxFromList.py 了!
8 [* x' B0 \0 m$ Y' S0 _输入:刚刚生成的 .txt 文件(文件名.txt)
: u& v( b3 ] u$ G' Q' T输出:文件名_customised.txt; \- Z8 T5 T* }: {( j
功能,仅保留 COCA5000_list.py 中 wordList 中的单词。如需修改单词列表,请使用 line2list.pt 生成列表并改变 customiseMdxFromList.py 中导入的 COCA5000_list 模块
- A+ r5 U( F: \性能:约 2.5 秒/词,5000 词合共约 3.5 小时
, a+ ~) {& v; D* [% H+ t Q, u5 e9 ~/ {. L
最后,使用 MdxBuilder.exe 将 文件名_customised.txt 打包为 .mdx 文件,用于 MDict 等词典软件
+ m$ K# Y G' q" U' ]5 L$ v4 W5 ]( I$ v2 I7 I
customiseMdxFromList.exe& o0 g ?8 q. _7 Z, u X- A- m
由 customiseMdxFromList.py 封装。不用搭建 Python 环境,且程序里面集成了 COCA5000 的单词表,直接在 Windows 上就能使用。 |
评分
-
1
查看全部评分
-
|