TA的每日心情 | 奋斗 2020-11-15 11:37 |
---|
签到天数: 249 天 [LV.8]以坛为家I
|
本帖最后由 lgmcw 于 2020-11-19 22:31 编辑 4 Q) i/ A" Z$ i# V8 z! J4 \
) U# Q8 {( r, ]& t. W' M
这帖target的是硬核玩家,希望对有需要的人有所帮助。代码比较乱,拖了好久都懒得整理,正好朋友又找我需要,趁着一鼓作气整理出来就正好也贴在论坛里吧。我这里不跟进你那边的环境调试了,如果有运行错误自己修一下(python3可参考楼下的修改经验);不过还是鼓励回帖反馈。对我以后做新人友好版有帮助。
& ]+ T" S4 Z0 s) G2 B以后我会做一款带GUI的,针对小白玩家。
8 A# z4 t: t! ^' ^; O u) H8 ]6 L6 O. g; L5 f- M0 d
入口文件,运行genMDX_ox4.py即可开始打包,附了一个牛津4的txt源码,我已经调试好,确保在我这里能工作,下载后可以直接运行用来测试程序。我的所有字典都是用这个程序打包,暂时没什么大问题。词条数最多我试过的简明英汉400多万词头;体积最大的OED,txt源码就有2.4G;这些打包都毫无压力。不过我这边还在用老古董python2.7;python3应该也能用,如果报错,可能需要自己debug一下。
0 S7 C8 \1 U! ?) i& v, x1 t7 ?genMDX_ox4.py is the entrance file you want to use in CMD/terminal. I've also enlcosed a OALD4_azure.txt for testing purpose.
7 N1 M2 O- g9 Z: Z# _2 a2 p+ l
3 J8 P7 _$ z$ {$ ]! W/ i" p+ p; v2 o S# \7 a2 a: }; Q8 X
$ e- M, E6 h+ T+ o; o$ ~" y
Windows下运行举例(需安装python):: W( y9 @( B9 ~: z8 h
7 S l( K7 ]# K! e4 y* _4 p8 B
- \! v4 U ?% V% g相较于原版我主要改了两个地方:' i8 p6 }5 O n. S" z* k
1. 在代码里,以前一个字典的key只能对应唯一个value。而MDict完全支持多个相同词头对应多个意思。所以我改了代码,让一个字典的key可以对应多个value。& c5 O% \! L( n! A( F5 v
2. 修改排序算法,原版是用的默认python排序,输出的文件在MDict简直不能查。GD勉强能查。
3 _4 l! s5 v' v5 ?% T+ T
9 M3 l) \$ u3 v" R& ~0 \5 Y
) U! i* o4 n5 Y' Q( A+ \5 D7 w* n- }$ R0 V
Python实现的txt转MDX代码:! ~5 W5 d* Q0 i+ v! v# \
$ ^9 O; n+ `: H7 C* a欢迎提建议. {, E/ D4 w, ^" j' ^, c* n4 `% m
⚜ 感兴趣可以看看我的其他字典,绝大部分都公开分享。. y* v! h# u0 n; J0 ^8 Q t! E' \7 [' k
5 I: X0 P( I. k$ Y/ k8 t8 M4 Z) d0 @' q' j& x; ~4 n+ f& _3 N# {
, ]. a2 b6 `$ J* f3 Y
6 M* N: i9 `; v% |/ U0 f, `) e$ a9 ]# {# d6 w( D
( L$ x0 ~' T9 B8 I5 u |
评分
-
5
查看全部评分
-
本帖被以下淘专辑推荐:
- · Top1|主题: 136, 订阅: 130
- · 超棒的词典!|主题: 44, 订阅: 45
- · 词典制作|主题: 217, 订阅: 40
- · lgmcw|主题: 13, 订阅: 35
- · 工具|主题: 61, 订阅: 28
- · 更多
|