TA的每日心情 | 奋斗 2019-10-11 13:52 |
---|
签到天数: 142 天 [LV.7]常住居民III
|
本帖最后由 Snowdax 于 2018-4-6 23:00 编辑 ' W- l6 {8 O/ R+ a4 S+ _
8 t- u" m! P- @' P5 Q; O) _- m已在 Github 上发布1 B) t$ L/ u2 p
https://github.com/Snowdax/customiseMdxFromList
1 S: R# I. ]& n( g* u: J1 ]: `8 @8 x: X; _, D; Q
readme 链接复制到论坛已失效,烦请移步 Github 阅读。5 n# e$ E4 \4 q% t
5 [: `+ {/ [+ {
欢迎打赏! https://snowdax.github.io/buyMeACupOfSoyMilk/! ]7 f* D% S3 M8 O: q
1 P) c6 D2 B" I* F
customiseMdxFromList, c7 `9 r8 j+ D5 U' g9 t9 Q
COCA5000.txt
9 i4 Z) W( n& b) |# c+ }COCA5000.txt 储存了 https://www.wordfrequency.info/free.asp?s=y 页面上的 COCA5000 词汇表,每个单词一行
& W# l# N" E/ R* E2 k/ E& K# w3 W2 A% r$ v
COCA5000_list.py
- H x/ u( ^- {! GCOCA5000_list.py 将上面的 txt 文件转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量,该 .py 文件可作为模块导入其他 Python 程序。这个文件是由 line2list.py 生成的。
7 Y7 g& \$ A7 @7 y& w) _3 A& y3 y, [5 \1 e5 d* J# b
line2list.py
2 ~" J, y% }- U8 p- L! V* [) k输入:文件名.txt1 T, ^9 F2 P, l2 N% X1 Y, `$ s
输出:文件名_list.txt0 m0 |0 ~: P5 p" J+ t5 O
功能:将每行的内容转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量。
" [4 t/ N- b. L- q) w/ g# O( f4 X1 g1 `. b4 L0 P# ~+ ~
customiseMdxFromList.py
; ]2 d* f) _) F+ q0 T2 f$ f首先将所需词库的 .mdx 文件在 GetDict.exe 中转换为 MDX 源文件,如下图所示:
K! s4 J% V4 {- B+ g8 H8 C
9 T2 ~8 C3 s% C3 e, Q4 ]# ^7 f) \1 B* T
生成的 .txt 类型的MDX 源文件,应该是一行词头,一行释义,一行 </>,如下图所示:- g2 {$ p& J' z% H
# y9 r7 @2 y: u% ]. |6 u1 v
+ `% N! f' H2 ]6 b接下来,就可以使用 customiseMdxFromList.py 了!8 F+ b5 L+ m' b! @+ ?8 X6 T& {
输入:刚刚生成的 .txt 文件(文件名.txt) l6 ]8 {. K4 j% }
输出:文件名_customised.txt* Y2 @) T5 c0 ~6 I9 {
功能,仅保留 COCA5000_list.py 中 wordList 中的单词。如需修改单词列表,请使用 line2list.pt 生成列表并改变 customiseMdxFromList.py 中导入的 COCA5000_list 模块8 [) M G) ~+ S4 U
性能:约 2.5 秒/词,5000 词合共约 3.5 小时1 r# J+ v! @, d, ^$ W0 ^& x! q
( C5 U5 b5 f2 D最后,使用 MdxBuilder.exe 将 文件名_customised.txt 打包为 .mdx 文件,用于 MDict 等词典软件3 F- o/ { H+ D. u
. v+ S6 D# X7 a$ O) H
customiseMdxFromList.exe8 Y& G; Z5 S6 J% f7 t
由 customiseMdxFromList.py 封装。不用搭建 Python 环境,且程序里面集成了 COCA5000 的单词表,直接在 Windows 上就能使用。 |
评分
-
1
查看全部评分
-
|