TA的每日心情 | 奋斗 2019-10-11 13:52 |
---|
签到天数: 142 天 [LV.7]常住居民III
|
本帖最后由 Snowdax 于 2018-4-6 23:00 编辑 7 i- n3 ]0 b; m& D; M5 M6 q5 u
3 F8 `% e' A. [; o* `4 P* s( O: m
已在 Github 上发布! B5 m5 {( C9 h- `, ]2 }
https://github.com/Snowdax/customiseMdxFromList
, F. E, C/ x6 l; r" S/ K# W8 J0 H! V V: e" z9 I8 Y
readme 链接复制到论坛已失效,烦请移步 Github 阅读。
" @: O$ b+ W. k1 V+ P% @' b4 ]/ O6 D; ~$ P
欢迎打赏! https://snowdax.github.io/buyMeACupOfSoyMilk/# {. l: \% d+ m' c
1 Y8 v% `# Y; s+ O" F# [
customiseMdxFromList& R$ `& I* g! Y% }) g; X1 a9 ?
COCA5000.txt
( h$ f- T) k/ D) gCOCA5000.txt 储存了 https://www.wordfrequency.info/free.asp?s=y 页面上的 COCA5000 词汇表,每个单词一行
" M8 G" X6 C9 t1 s4 {0 q6 H( ~1 A9 m& N* ?6 y6 }6 V# E7 j
COCA5000_list.py! N. G, R2 g* U4 ]5 m
COCA5000_list.py 将上面的 txt 文件转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量,该 .py 文件可作为模块导入其他 Python 程序。这个文件是由 line2list.py 生成的。8 w% o+ S6 f% e/ X' Y- V
: l1 j6 W9 y7 `& p+ K4 Mline2list.py* Y+ o) q, X) }4 @' h
输入:文件名.txt" d: I; d- J1 i; e
输出:文件名_list.txt/ W0 P- i& R' h" f
功能:将每行的内容转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量。; G3 _/ w# ]6 X6 h% B8 `
. w1 y( M: e4 i0 u( l4 dcustomiseMdxFromList.py8 _9 c$ l0 |2 S
首先将所需词库的 .mdx 文件在 GetDict.exe 中转换为 MDX 源文件,如下图所示:1 F+ {& ?# G' ~
6 E2 l1 \" h/ x5 B% N) R8 K3 {
4 K& H# o) W( i' d/ A$ M, I: H生成的 .txt 类型的MDX 源文件,应该是一行词头,一行释义,一行 </>,如下图所示:
F" O/ P, ^9 [$ q8 ^" H( q8 v6 c! R6 d: _1 C
- C! p% m+ `1 K, H' |' `$ @& ~
接下来,就可以使用 customiseMdxFromList.py 了!$ y4 C3 \2 s8 G
输入:刚刚生成的 .txt 文件(文件名.txt)9 ^* S* b1 C1 e5 u, Y5 n8 s
输出:文件名_customised.txt( b2 K- e0 V6 { O- I0 _4 g6 R
功能,仅保留 COCA5000_list.py 中 wordList 中的单词。如需修改单词列表,请使用 line2list.pt 生成列表并改变 customiseMdxFromList.py 中导入的 COCA5000_list 模块
) g/ E' n, n5 x2 Q6 E" X性能:约 2.5 秒/词,5000 词合共约 3.5 小时) U7 Q, w+ q* g- G+ p, ?( Q
9 K% J1 B; ?8 S5 P* y3 Q& \, Q
最后,使用 MdxBuilder.exe 将 文件名_customised.txt 打包为 .mdx 文件,用于 MDict 等词典软件6 W, T% P" ]8 {% ~3 w) ^. h
; w& P. y r. a7 Y! F# C1 i
customiseMdxFromList.exe
, x- D/ d1 |& R3 d* f3 V由 customiseMdxFromList.py 封装。不用搭建 Python 环境,且程序里面集成了 COCA5000 的单词表,直接在 Windows 上就能使用。 |
评分
-
1
查看全部评分
-
|