TA的每日心情 | 奋斗 2020-11-15 11:37 |
---|
签到天数: 249 天 [LV.8]以坛为家I
|
本帖最后由 lgmcw 于 2020-11-19 22:31 编辑 ' u+ c% H4 |! x
4 s S$ `, w# n- U7 h" f: Y这帖target的是硬核玩家,希望对有需要的人有所帮助。代码比较乱,拖了好久都懒得整理,正好朋友又找我需要,趁着一鼓作气整理出来就正好也贴在论坛里吧。我这里不跟进你那边的环境调试了,如果有运行错误自己修一下(python3可参考楼下的修改经验);不过还是鼓励回帖反馈。对我以后做新人友好版有帮助。
! c$ J5 c3 w6 ]以后我会做一款带GUI的,针对小白玩家。
7 x; D2 Z5 V/ l
- f; C) x$ X2 k5 x; ~7 |入口文件,运行genMDX_ox4.py即可开始打包,附了一个牛津4的txt源码,我已经调试好,确保在我这里能工作,下载后可以直接运行用来测试程序。我的所有字典都是用这个程序打包,暂时没什么大问题。词条数最多我试过的简明英汉400多万词头;体积最大的OED,txt源码就有2.4G;这些打包都毫无压力。不过我这边还在用老古董python2.7;python3应该也能用,如果报错,可能需要自己debug一下。! B7 p+ ]% T, C! k: h3 V
genMDX_ox4.py is the entrance file you want to use in CMD/terminal. I've also enlcosed a OALD4_azure.txt for testing purpose.
6 ~% L. h2 C4 K7 Y( _- P$ }
& [% ~( z0 p. W# b- A
. c! I* I+ U: U2 l# o9 O
3 O! B7 F9 U6 }0 R3 u- p$ K& p6 DWindows下运行举例(需安装python):
" ]0 q& H" m; x& |+ V5 U( U$ z9 W" O& L- K+ n6 y
, m, C: C& P1 Q3 U' o相较于原版我主要改了两个地方:
- U% z& X ]/ m3 J7 S# E1. 在代码里,以前一个字典的key只能对应唯一个value。而MDict完全支持多个相同词头对应多个意思。所以我改了代码,让一个字典的key可以对应多个value。. Y7 L7 i7 {* e* @# F0 U7 b0 w
2. 修改排序算法,原版是用的默认python排序,输出的文件在MDict简直不能查。GD勉强能查。& P, {3 h2 j1 P2 S+ O$ p3 U6 R) q
$ j- r `/ Q* m- d$ v# l
9 t, e9 c# X; d0 C, C4 l+ r9 V
& ]' h% A$ c% d1 d
Python实现的txt转MDX代码:
3 B% W8 ^9 s+ |) a! y! t. `# S1 H4 x; F
欢迎提建议
* m T+ I7 W! U7 n* I⚜ 感兴趣可以看看我的其他字典,绝大部分都公开分享。% q: [4 k3 g( g1 e, w# G
1 d4 t! c9 B4 _0 _4 W6 g( ~( p f# ?- b' Y* S1 G$ G: ^ c. v6 r
u( E7 ?" H. x$ b$ k0 D I
: a% P4 ]9 {% _4 t6 N( Z% U
; {$ V$ f" P/ l! u8 Q4 ]* r) {: o; u
. w( v0 x' Y3 V- }/ R ?
|
评分
-
5
查看全部评分
-
本帖被以下淘专辑推荐:
- · Top1|主题: 136, 订阅: 130
- · 超棒的词典!|主题: 44, 订阅: 45
- · 词典制作|主题: 217, 订阅: 40
- · lgmcw|主题: 13, 订阅: 35
- · 工具|主题: 61, 订阅: 28
- · 更多
|