TA的每日心情 | 奋斗 2019-10-11 13:52 |
---|
签到天数: 142 天 [LV.7]常住居民III
|
本帖最后由 Snowdax 于 2018-4-6 23:00 编辑 % p# t3 Q8 ]; |; R3 o
5 q3 }* r* V/ i) u
已在 Github 上发布
7 I( A. {2 n8 o" Fhttps://github.com/Snowdax/customiseMdxFromList
" N7 L6 B0 S. r3 l7 o
! {: w% M) S+ \2 {( W' breadme 链接复制到论坛已失效,烦请移步 Github 阅读。1 c8 w" ]: }# _$ c* w8 [: W% u, t
1 z2 t9 U% ]8 a1 t E2 @& l
欢迎打赏! https://snowdax.github.io/buyMeACupOfSoyMilk/
+ b, ]8 w+ ?: ]* b: d1 v0 z) f+ G
customiseMdxFromList
; d2 h. E9 w- g8 f) s. \, dCOCA5000.txt$ c+ P0 p) L$ y2 |. C5 V- I
COCA5000.txt 储存了 https://www.wordfrequency.info/free.asp?s=y 页面上的 COCA5000 词汇表,每个单词一行; I: c* o( n. P0 r( v
) V1 r0 ~5 F2 ~( S9 V8 g$ T# d
COCA5000_list.py
! [8 l! z& R) Y7 HCOCA5000_list.py 将上面的 txt 文件转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量,该 .py 文件可作为模块导入其他 Python 程序。这个文件是由 line2list.py 生成的。. i# c8 K$ a0 N d4 ?# Z
* A5 [' S9 ]" p) K3 U& s( e
line2list.py
& }; b) R2 | B2 {% C) ^输入:文件名.txt
# ~( I0 b! ~ Y4 d k9 E8 m输出:文件名_list.txt
4 K1 U; V- T+ g: m5 l5 A功能:将每行的内容转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量。
) n- A# V' A/ c7 w: }' b% j$ _: ?1 K: K+ r
customiseMdxFromList.py
. _( k* w6 H3 z首先将所需词库的 .mdx 文件在 GetDict.exe 中转换为 MDX 源文件,如下图所示:
9 A* t3 e+ c: C; q- @! n6 J8 Q6 _6 O! S; t/ s
4 g* n+ m4 a, L9 H7 ~. x( c生成的 .txt 类型的MDX 源文件,应该是一行词头,一行释义,一行 </>,如下图所示:
0 A2 x$ S' s2 T1 V+ D3 h7 b- [
2 T6 `8 q' Q+ }* p* t* [0 S; L: R* {& T( w* p5 k
接下来,就可以使用 customiseMdxFromList.py 了!
4 z& j) c9 o6 K6 R+ Q w7 s) q输入:刚刚生成的 .txt 文件(文件名.txt)
& j3 _* H6 S; g) u8 g2 c输出:文件名_customised.txt
' y8 J# f. }# z! [( f' R功能,仅保留 COCA5000_list.py 中 wordList 中的单词。如需修改单词列表,请使用 line2list.pt 生成列表并改变 customiseMdxFromList.py 中导入的 COCA5000_list 模块
/ _# h1 v0 a: s9 m+ y1 { r性能:约 2.5 秒/词,5000 词合共约 3.5 小时
: }0 [; I& t9 k
- W4 w! P- b& L3 C7 l( K/ d% c最后,使用 MdxBuilder.exe 将 文件名_customised.txt 打包为 .mdx 文件,用于 MDict 等词典软件' j+ h" c+ `4 U
* d: h) S2 x5 v/ [: F
customiseMdxFromList.exe+ C) R$ Z- y, Q+ X0 ^
由 customiseMdxFromList.py 封装。不用搭建 Python 环境,且程序里面集成了 COCA5000 的单词表,直接在 Windows 上就能使用。 |
评分
-
1
查看全部评分
-
|