TA的每日心情 | 奋斗 2019-10-11 13:52 |
---|
签到天数: 142 天 [LV.7]常住居民III
|
本帖最后由 Snowdax 于 2018-4-6 23:00 编辑 3 N4 W8 ^) T% W7 N( m" p( m
$ S- {/ Z% z4 k$ y' d: O
已在 Github 上发布/ N. ^7 J4 r0 c8 W
https://github.com/Snowdax/customiseMdxFromList
9 A( ^5 r& n1 E7 m B: r9 H% z1 U4 U7 N; X# m
readme 链接复制到论坛已失效,烦请移步 Github 阅读。
. U0 W4 N; i; e7 S
6 U9 Y; `$ U7 m$ n. ?欢迎打赏! https://snowdax.github.io/buyMeACupOfSoyMilk/
3 [9 u; ?# c# H( w
% {. B$ N9 J$ [/ {) x; `% [customiseMdxFromList& u. [0 I8 A$ L& s$ {* V
COCA5000.txt6 X; K) j- T. X# z9 D& `
COCA5000.txt 储存了 https://www.wordfrequency.info/free.asp?s=y 页面上的 COCA5000 词汇表,每个单词一行
& I1 I/ T, v% e: u' s C/ f+ N# y* y+ v m: a
COCA5000_list.py0 X# ? C4 h4 J+ P1 W1 p
COCA5000_list.py 将上面的 txt 文件转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量,该 .py 文件可作为模块导入其他 Python 程序。这个文件是由 line2list.py 生成的。
$ }1 X# e+ c1 o" J' D" Z8 {0 b& e! I
line2list.py
8 w( N# T+ @6 U+ @# g输入:文件名.txt7 e# |: W5 B7 O6 k2 K
输出:文件名_list.txt
! t9 H! N% B9 ~9 U4 e功能:将每行的内容转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量。* P0 N. ?) b' x, P: B) ~, B0 \
]7 o! Q5 \( Z' {& PcustomiseMdxFromList.py
1 }9 U5 V/ J( Q2 F首先将所需词库的 .mdx 文件在 GetDict.exe 中转换为 MDX 源文件,如下图所示:4 Y5 b3 ]. O( y; L) T" N) S0 n
: M% W( w5 M$ [( ^! ?! K2 B( y; U0 t- \& j" H% x0 f
生成的 .txt 类型的MDX 源文件,应该是一行词头,一行释义,一行 </>,如下图所示:" h+ _+ ^6 K0 j+ {
8 U& X6 ]6 Y( B+ h
6 n3 u% ~1 \- S% B& \2 U接下来,就可以使用 customiseMdxFromList.py 了!
9 Q1 g, W# I8 R- T/ t) j, t, p输入:刚刚生成的 .txt 文件(文件名.txt)
0 A/ T/ s3 q) I/ y输出:文件名_customised.txt
6 h, z$ T/ j1 b# d功能,仅保留 COCA5000_list.py 中 wordList 中的单词。如需修改单词列表,请使用 line2list.pt 生成列表并改变 customiseMdxFromList.py 中导入的 COCA5000_list 模块4 U7 Y3 A8 m) e3 }2 @8 B3 i
性能:约 2.5 秒/词,5000 词合共约 3.5 小时
. }2 y8 T. x1 {/ M: B, A3 C9 Z, c6 t5 ^3 V1 N1 G9 T
最后,使用 MdxBuilder.exe 将 文件名_customised.txt 打包为 .mdx 文件,用于 MDict 等词典软件
+ f x+ q4 m( e4 \4 s' g; C" n
8 Y5 Q7 O! |, p; t0 wcustomiseMdxFromList.exe$ d' q/ a/ r3 K
由 customiseMdxFromList.py 封装。不用搭建 Python 环境,且程序里面集成了 COCA5000 的单词表,直接在 Windows 上就能使用。 |
评分
-
1
查看全部评分
-
|