TA的每日心情 | 奋斗 2019-10-11 13:52 |
|---|
签到天数: 142 天 [LV.7]常住居民III
|
本帖最后由 Snowdax 于 2018-4-6 23:00 编辑
& F9 Q$ v! T+ V8 b) p1 m+ ]4 y3 S3 Z2 F5 q
已在 Github 上发布/ u. V1 U3 G0 Q! k6 H/ ]% i6 Q+ B, ~
https://github.com/Snowdax/customiseMdxFromList' h1 T6 M0 v8 ~9 f- G, b
4 u( i& x7 U4 V# e3 r. ^+ kreadme 链接复制到论坛已失效,烦请移步 Github 阅读。! `- R6 ^" \ }
& O& \% N# d1 W' V: i
欢迎打赏! https://snowdax.github.io/buyMeACupOfSoyMilk/
9 p; m" i6 t+ u# D6 {5 K i; c$ ^, C1 m$ I3 z
customiseMdxFromList
8 k9 r6 }3 Z, X4 YCOCA5000.txt* i; T. {# d2 ~
COCA5000.txt 储存了 https://www.wordfrequency.info/free.asp?s=y 页面上的 COCA5000 词汇表,每个单词一行' L- o7 b4 S, K, B* r
( E# f" J S0 u" m' S- t
COCA5000_list.py
' I" ~ S2 B# n; _- ?; y3 _COCA5000_list.py 将上面的 txt 文件转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量,该 .py 文件可作为模块导入其他 Python 程序。这个文件是由 line2list.py 生成的。" Q9 T* _( l. }/ ^+ |
\5 Z0 p7 ]) h; \4 K' i
line2list.py0 z/ z& n1 W, q( w5 V9 t
输入:文件名.txt, M4 f" y4 M2 @8 ~
输出:文件名_list.txt* T& n! f* L. O# T, s; V$ T
功能:将每行的内容转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量。$ z2 H7 e+ @' y
& E4 W. `0 r) x3 n" Q G% C q9 AcustomiseMdxFromList.py* H3 F. O; C) X" e8 V0 G, U
首先将所需词库的 .mdx 文件在 GetDict.exe 中转换为 MDX 源文件,如下图所示:
. m0 k( \( k2 r' ?+ x# W
' y4 }% V0 P- t, l6 t" Y& k3 x$ R7 x, n
生成的 .txt 类型的MDX 源文件,应该是一行词头,一行释义,一行 </>,如下图所示:
0 S6 x3 B9 f' B/ p: j
1 a( y( D9 M' I& N$ _) A
' x3 K: f5 y, P5 f1 |5 B接下来,就可以使用 customiseMdxFromList.py 了!
5 C. I" r% P; r$ T+ E输入:刚刚生成的 .txt 文件(文件名.txt)
5 U8 O1 J/ ?: [5 T7 M输出:文件名_customised.txt
: ~2 v% g- g. }! m( e# X功能,仅保留 COCA5000_list.py 中 wordList 中的单词。如需修改单词列表,请使用 line2list.pt 生成列表并改变 customiseMdxFromList.py 中导入的 COCA5000_list 模块
: y5 E! C2 T$ K' i' d6 [性能:约 2.5 秒/词,5000 词合共约 3.5 小时
$ H/ o6 P) u5 V2 N, Z1 K. \, h- {3 `' w9 o+ R, }2 ~
最后,使用 MdxBuilder.exe 将 文件名_customised.txt 打包为 .mdx 文件,用于 MDict 等词典软件$ B2 S5 G3 v) `) _) Z2 Z( ~% [1 p$ j
2 J! ^4 t9 y% NcustomiseMdxFromList.exe: [* \7 U$ M' {
由 customiseMdxFromList.py 封装。不用搭建 Python 环境,且程序里面集成了 COCA5000 的单词表,直接在 Windows 上就能使用。 |
评分
-
1
查看全部评分
-
|