TA的每日心情 | 奋斗 2019-10-11 13:52 |
---|
签到天数: 142 天 [LV.7]常住居民III
|
本帖最后由 Snowdax 于 2018-4-6 23:00 编辑 Q! \' O+ t3 j! S# c6 @
0 c" D& }' Z" k5 z
已在 Github 上发布
& U0 t+ i# I" V/ V$ T0 uhttps://github.com/Snowdax/customiseMdxFromList$ K% T9 b% h5 [5 j; M/ Y q
' t; n& C6 D) D, R. e; m$ t: Q" K" ereadme 链接复制到论坛已失效,烦请移步 Github 阅读。
- K' M }; u1 k8 E8 D1 K
9 F% A4 U) N6 k欢迎打赏! https://snowdax.github.io/buyMeACupOfSoyMilk/% P1 f! `9 s9 P# y0 y" k3 ^' i
* J3 o5 r5 Q9 ~" lcustomiseMdxFromList
0 |) Z, s# G% O' M T3 Z" PCOCA5000.txt$ z! N: x, t( b& N5 j- T v
COCA5000.txt 储存了 https://www.wordfrequency.info/free.asp?s=y 页面上的 COCA5000 词汇表,每个单词一行) i) ^ m1 F7 |5 Y/ o
9 v! `, L% W# Z4 y: FCOCA5000_list.py+ H o5 y; ]4 C
COCA5000_list.py 将上面的 txt 文件转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量,该 .py 文件可作为模块导入其他 Python 程序。这个文件是由 line2list.py 生成的。
* c; n1 \5 h# G( a& j. D
6 Y" u4 @. m- p. s- j: Iline2list.py) Q/ ]. B$ s& f' c; K/ o' ~7 N
输入:文件名.txt7 \9 m$ s0 k% W- J
输出:文件名_list.txt, Y' r" n) u2 ?) ?8 T
功能:将每行的内容转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量。2 e9 a6 |0 f; C2 p2 |; k
" W( }: j0 J# ?% _" A
customiseMdxFromList.py1 J, S2 S! t7 `, [$ M
首先将所需词库的 .mdx 文件在 GetDict.exe 中转换为 MDX 源文件,如下图所示:; l8 W+ l1 R, s: i. n7 l; X
- b. Q/ x0 K( E* s* X
/ S+ x& j0 ?% h( y9 {( l, x' t
生成的 .txt 类型的MDX 源文件,应该是一行词头,一行释义,一行 </>,如下图所示:8 L" @$ m" D% `! v, Z
2 ~# y o$ w; F, v9 N1 h% l+ _# {! ]
接下来,就可以使用 customiseMdxFromList.py 了!
2 k4 p1 X. {$ g2 q* J. w& ^3 F& `输入:刚刚生成的 .txt 文件(文件名.txt)
- S3 |# k) @1 d3 d输出:文件名_customised.txt
$ V. T! @) P) i7 N9 W" R: g7 ]功能,仅保留 COCA5000_list.py 中 wordList 中的单词。如需修改单词列表,请使用 line2list.pt 生成列表并改变 customiseMdxFromList.py 中导入的 COCA5000_list 模块5 Y3 U+ j3 G2 J! P7 |
性能:约 2.5 秒/词,5000 词合共约 3.5 小时
/ ^' Z& i# B4 @3 M7 B% a( [2 Q; q; M9 @& M, t$ [
最后,使用 MdxBuilder.exe 将 文件名_customised.txt 打包为 .mdx 文件,用于 MDict 等词典软件
* b. b; Q3 t! C
! N2 Y0 n9 ~. Q4 I8 KcustomiseMdxFromList.exe5 G' @7 q; D# T4 s: a, P7 ]
由 customiseMdxFromList.py 封装。不用搭建 Python 环境,且程序里面集成了 COCA5000 的单词表,直接在 Windows 上就能使用。 |
评分
-
1
查看全部评分
-
|