TA的每日心情 | 奋斗 2019-10-11 13:52 |
---|
签到天数: 142 天 [LV.7]常住居民III
|
本帖最后由 Snowdax 于 2018-4-6 23:00 编辑
: g# }; G. Q% X: S% L( W0 l4 C2 z. I6 ~
已在 Github 上发布
* r8 X; b/ k' c0 Qhttps://github.com/Snowdax/customiseMdxFromList
! t0 b' [+ ^$ }7 _0 g2 {3 ]% P
r) ^7 @ s8 C0 xreadme 链接复制到论坛已失效,烦请移步 Github 阅读。+ Q+ M2 K2 @* j V+ s
8 d7 ?0 ~4 C4 e
欢迎打赏! https://snowdax.github.io/buyMeACupOfSoyMilk/
% o/ D* F- q h6 _( C/ F5 R6 R9 E: `& i: k) {
customiseMdxFromList- X4 e7 D/ G: s$ s9 P- }# p) c
COCA5000.txt' d; m* r/ {2 J" p
COCA5000.txt 储存了 https://www.wordfrequency.info/free.asp?s=y 页面上的 COCA5000 词汇表,每个单词一行( D0 i8 ?$ L" G, t
6 H* w& ^% v3 ?COCA5000_list.py
: ~0 I! }; [/ D. hCOCA5000_list.py 将上面的 txt 文件转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量,该 .py 文件可作为模块导入其他 Python 程序。这个文件是由 line2list.py 生成的。
) }% g0 A @6 ~( n) E; ^" g: ]1 K# f8 i9 h. L& [+ w
line2list.py) [5 G3 G. J9 D
输入:文件名.txt( k* Q9 E# i9 H2 `: N# R
输出:文件名_list.txt# x0 p/ C9 S/ D
功能:将每行的内容转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量。
) F7 j+ ~' ~& P( F7 s7 o5 @, i. s' n
customiseMdxFromList.py: s4 i$ z- D& R0 L# y
首先将所需词库的 .mdx 文件在 GetDict.exe 中转换为 MDX 源文件,如下图所示:/ ^# i! |' X6 z, Y# A' I# i; R
6 P+ K/ A2 o8 \+ Y' w
* z% J4 A% o! u; k
生成的 .txt 类型的MDX 源文件,应该是一行词头,一行释义,一行 </>,如下图所示:
, J O2 H2 m5 j1 S# _3 U# u
$ W9 i3 Q7 ~# M; X5 y
# i# B0 [5 {/ z. M$ p" t$ ~+ \接下来,就可以使用 customiseMdxFromList.py 了!
6 N& h. m5 z. |& p. p- W输入:刚刚生成的 .txt 文件(文件名.txt)
5 w- I, h' ?/ y/ K输出:文件名_customised.txt
" Z# F' G$ E! P) v功能,仅保留 COCA5000_list.py 中 wordList 中的单词。如需修改单词列表,请使用 line2list.pt 生成列表并改变 customiseMdxFromList.py 中导入的 COCA5000_list 模块
b; V/ ^4 {: m8 u4 p* a' R性能:约 2.5 秒/词,5000 词合共约 3.5 小时
% [6 q% s, F1 [: K o( X x, m7 D* h) e( A) n
最后,使用 MdxBuilder.exe 将 文件名_customised.txt 打包为 .mdx 文件,用于 MDict 等词典软件$ H0 d2 ^* t% D- B
# H9 v1 P6 _3 v0 @7 g6 G4 jcustomiseMdxFromList.exe
: R# S/ h( U7 ^2 I6 H0 D5 q$ Q由 customiseMdxFromList.py 封装。不用搭建 Python 环境,且程序里面集成了 COCA5000 的单词表,直接在 Windows 上就能使用。 |
评分
-
1
查看全部评分
-
|