TA的每日心情 | 奋斗 2019-10-11 13:52 |
---|
签到天数: 142 天 [LV.7]常住居民III
|
本帖最后由 Snowdax 于 2018-4-6 23:00 编辑 b A- [2 @3 A
" _0 [/ B4 g- x# `& X: L
已在 Github 上发布
+ [2 @1 a& _5 n5 c) `https://github.com/Snowdax/customiseMdxFromList
& E# D; W# i3 |2 q, ^9 J. b: x9 _) L& ^* l/ X
readme 链接复制到论坛已失效,烦请移步 Github 阅读。
; [) C: ~6 h7 }6 T7 B2 e; q1 `
! H# C* g C' K- _8 c4 Q. E# e" X1 d9 r欢迎打赏! https://snowdax.github.io/buyMeACupOfSoyMilk/% d3 ~- m: A) s# y. `
/ B* E" [" j( K4 C! q5 h
customiseMdxFromList# h/ w# @2 T% y+ g' z+ k
COCA5000.txt
8 [, B6 G9 X6 n; VCOCA5000.txt 储存了 https://www.wordfrequency.info/free.asp?s=y 页面上的 COCA5000 词汇表,每个单词一行
1 N5 H9 F/ {' L. u8 [: W/ @# j; v& r) c' i- W, d& @
COCA5000_list.py! c! }# n& P# P* o. X0 k0 l
COCA5000_list.py 将上面的 txt 文件转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量,该 .py 文件可作为模块导入其他 Python 程序。这个文件是由 line2list.py 生成的。/ D/ L/ Z1 Z6 f1 W9 j
1 U' B; @5 N0 f# A$ O+ Y* M8 m* @
line2list.py
3 O7 i0 X2 A8 t& W8 \% j输入:文件名.txt
3 ?$ H% `% |# a, m; E% S+ ?输出:文件名_list.txt0 h! `4 P' S! F3 O) {1 D. d3 m
功能:将每行的内容转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量。
7 M+ n4 [9 V3 k6 x' L$ {) m; P
! ^& ?: v4 Z) k0 K( n5 q+ qcustomiseMdxFromList.py6 }5 `7 ]0 G: m( \
首先将所需词库的 .mdx 文件在 GetDict.exe 中转换为 MDX 源文件,如下图所示:
1 S7 W' t: ^* X4 n7 \+ I
y8 A; c2 z1 T2 M. c3 r" m1 p2 u7 x' N5 u0 h+ N
生成的 .txt 类型的MDX 源文件,应该是一行词头,一行释义,一行 </>,如下图所示:
$ N, W) o6 I6 t- b4 N+ V& Y, z$ z1 Z0 [& i7 B, @5 {4 X& h: W
8 a4 D3 Y% c3 f# q# F: q: l接下来,就可以使用 customiseMdxFromList.py 了!
2 N f: ?8 g$ c/ T" P输入:刚刚生成的 .txt 文件(文件名.txt)
# m4 x" h2 x3 X3 w# X9 [% \输出:文件名_customised.txt; p; ^6 ?1 ]+ _+ v$ G
功能,仅保留 COCA5000_list.py 中 wordList 中的单词。如需修改单词列表,请使用 line2list.pt 生成列表并改变 customiseMdxFromList.py 中导入的 COCA5000_list 模块
4 @; o7 D8 s( C4 q性能:约 2.5 秒/词,5000 词合共约 3.5 小时
" t! o& ~8 T( P
' A9 d1 W$ j$ B5 v8 R m最后,使用 MdxBuilder.exe 将 文件名_customised.txt 打包为 .mdx 文件,用于 MDict 等词典软件9 D {( h% ^+ v) |/ _+ U' Q. V' X7 X
: q S+ q i3 E/ T/ gcustomiseMdxFromList.exe
7 I% u$ A( x* Q; c' p* @由 customiseMdxFromList.py 封装。不用搭建 Python 环境,且程序里面集成了 COCA5000 的单词表,直接在 Windows 上就能使用。 |
评分
-
1
查看全部评分
-
|