TA的每日心情 | 奋斗 2019-10-11 13:52 |
---|
签到天数: 142 天 [LV.7]常住居民III
|
本帖最后由 Snowdax 于 2018-4-6 23:00 编辑
& o0 d1 q% p$ D, g7 A# `2 R
6 q- |; y! p; o% {已在 Github 上发布. ~% k+ a4 ~! h$ q
https://github.com/Snowdax/customiseMdxFromList! ?0 u2 \$ n3 A( h% g$ I- n0 _
7 X6 g( E' |9 k7 F# X) ^: C8 h
readme 链接复制到论坛已失效,烦请移步 Github 阅读。
6 L; u8 m$ G$ M# I
' j+ L1 p; \9 }" ~: r A欢迎打赏! https://snowdax.github.io/buyMeACupOfSoyMilk/
6 @( d) F! X" e- ?3 i6 m; i7 q6 H2 x
customiseMdxFromList
( k1 y p; Q$ L* ^/ ^' OCOCA5000.txt
0 y$ x1 t- J2 \& K+ pCOCA5000.txt 储存了 https://www.wordfrequency.info/free.asp?s=y 页面上的 COCA5000 词汇表,每个单词一行
! X/ X5 Y' j, N8 u9 j: g) ], c9 g
+ `6 x2 r3 e* {& [! j' x1 FCOCA5000_list.py2 p& i% z) \$ H" @
COCA5000_list.py 将上面的 txt 文件转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量,该 .py 文件可作为模块导入其他 Python 程序。这个文件是由 line2list.py 生成的。; }& P# K v7 f% H
+ [9 ^* u9 H D! L& i0 N0 \: s! v
line2list.py# ]& }/ c' I" A' }! c
输入:文件名.txt5 K0 S; v9 X/ P+ y
输出:文件名_list.txt
8 F, {7 H" K# u9 b, W) A功能:将每行的内容转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量。
, B4 M/ J. F" \. M0 F6 g$ u( U+ B1 i8 ?( `) ~% ]5 z
customiseMdxFromList.py, f+ v0 b9 U, l& p' _5 Z5 e( b' O
首先将所需词库的 .mdx 文件在 GetDict.exe 中转换为 MDX 源文件,如下图所示:
) H5 |8 K$ n5 }9 J6 l$ n* ~& [! W: \5 T& ^6 x8 R) m
0 K( j$ v; ^% b+ I, C! s& f
生成的 .txt 类型的MDX 源文件,应该是一行词头,一行释义,一行 </>,如下图所示:6 k7 O, \# O6 O3 \
1 \- O# c7 d% Q/ X
5 x( U/ Y: l0 K) Y2 ^# K接下来,就可以使用 customiseMdxFromList.py 了!
9 y! r& u' _/ G输入:刚刚生成的 .txt 文件(文件名.txt)0 R `4 w( S& k7 `: q" |
输出:文件名_customised.txt
& b; H q$ f0 e+ m3 y功能,仅保留 COCA5000_list.py 中 wordList 中的单词。如需修改单词列表,请使用 line2list.pt 生成列表并改变 customiseMdxFromList.py 中导入的 COCA5000_list 模块
3 ?, B+ Y6 [" G, j6 ]* F性能:约 2.5 秒/词,5000 词合共约 3.5 小时3 Y6 ^4 |. h" B; v* D) D% `
2 K7 Q9 r" ^. `% Z8 t& m/ D2 \+ X
最后,使用 MdxBuilder.exe 将 文件名_customised.txt 打包为 .mdx 文件,用于 MDict 等词典软件 ]* s- N" z. V, k' V) a5 o# m* O8 ~, h# A
* u. y' q/ x/ p% U y, ]
customiseMdxFromList.exe
: N6 p1 Q8 k+ V由 customiseMdxFromList.py 封装。不用搭建 Python 环境,且程序里面集成了 COCA5000 的单词表,直接在 Windows 上就能使用。 |
评分
-
1
查看全部评分
-
|