TA的每日心情 | 奋斗 2020-11-15 11:37 |
---|
签到天数: 249 天 [LV.8]以坛为家I
|
本帖最后由 lgmcw 于 2020-11-19 22:31 编辑
8 ^: s% N4 @/ D4 A B3 u+ K0 |* Y' p6 T* D% i3 v/ {* q
这帖target的是硬核玩家,希望对有需要的人有所帮助。代码比较乱,拖了好久都懒得整理,正好朋友又找我需要,趁着一鼓作气整理出来就正好也贴在论坛里吧。我这里不跟进你那边的环境调试了,如果有运行错误自己修一下(python3可参考楼下的修改经验);不过还是鼓励回帖反馈。对我以后做新人友好版有帮助。; E7 ?/ v% |7 k9 G: i2 \ f; x
以后我会做一款带GUI的,针对小白玩家。1 Y* w3 D8 a7 f! T/ d( X2 c
; w1 v, d- h: w0 c7 W5 g% ?# L入口文件,运行genMDX_ox4.py即可开始打包,附了一个牛津4的txt源码,我已经调试好,确保在我这里能工作,下载后可以直接运行用来测试程序。我的所有字典都是用这个程序打包,暂时没什么大问题。词条数最多我试过的简明英汉400多万词头;体积最大的OED,txt源码就有2.4G;这些打包都毫无压力。不过我这边还在用老古董python2.7;python3应该也能用,如果报错,可能需要自己debug一下。6 h; K# W8 P, S( j
genMDX_ox4.py is the entrance file you want to use in CMD/terminal. I've also enlcosed a OALD4_azure.txt for testing purpose.
4 e& x; O p/ K) \9 |* V, O) O9 e* \: F; ]: P1 |
6 A4 L: \6 L `
9 ~- r" c2 B8 c5 h9 a8 V
Windows下运行举例(需安装python):
) C6 Z) u# w5 E- }7 F4 {: h }3 ?4 P" ~- w5 j1 D
' T! M& y" m6 h E; A, U' S
相较于原版我主要改了两个地方:/ W8 u5 j4 F$ S) f v
1. 在代码里,以前一个字典的key只能对应唯一个value。而MDict完全支持多个相同词头对应多个意思。所以我改了代码,让一个字典的key可以对应多个value。8 @& g% D, f# b" o$ u: ?
2. 修改排序算法,原版是用的默认python排序,输出的文件在MDict简直不能查。GD勉强能查。
4 |, _' R( L; M$ Y4 W$ B3 l) N- ^% o, V2 q
$ K. W1 ~0 z# D0 v+ v9 N* ]3 x& B) ~+ I
Python实现的txt转MDX代码:
) C5 z; j/ I' r, b. L: S5 p$ {: Z% A4 j$ p4 d) e* j% k; \$ t
欢迎提建议( I1 c5 S! k, V4 | F/ T- [
⚜ 感兴趣可以看看我的其他字典,绝大部分都公开分享。+ y4 @/ F0 Q* s7 j' Q* s6 N( V0 u
' o; T; ?" h [
. h, E# d# d% i( @( H- p; N, B+ Q9 ?( h" q" C# g! O
/ e5 b4 z. w9 a5 i! j4 ~1 c+ o6 J3 O4 z0 h
4 v0 q# X! H1 B7 V, _
|
评分
-
5
查看全部评分
-
本帖被以下淘专辑推荐:
- · Top1|主题: 136, 订阅: 130
- · 超棒的词典!|主题: 44, 订阅: 45
- · 词典制作|主题: 217, 订阅: 40
- · lgmcw|主题: 13, 订阅: 35
- · 工具|主题: 61, 订阅: 28
- · 更多
|