TA的每日心情 | 奋斗 2020-11-15 11:37 |
---|
签到天数: 249 天 [LV.8]以坛为家I
|
本帖最后由 lgmcw 于 2020-11-19 22:31 编辑
# c& ?# Q$ s9 {5 J$ u& l0 X/ X. x- O9 V
这帖target的是硬核玩家,希望对有需要的人有所帮助。代码比较乱,拖了好久都懒得整理,正好朋友又找我需要,趁着一鼓作气整理出来就正好也贴在论坛里吧。我这里不跟进你那边的环境调试了,如果有运行错误自己修一下(python3可参考楼下的修改经验);不过还是鼓励回帖反馈。对我以后做新人友好版有帮助。3 c8 `" e) `, C; C7 A, P& s: p
以后我会做一款带GUI的,针对小白玩家。
. _. E3 F# M, E/ {" f( Z' n+ F2 c) t9 J7 p% V! b5 e
入口文件,运行genMDX_ox4.py即可开始打包,附了一个牛津4的txt源码,我已经调试好,确保在我这里能工作,下载后可以直接运行用来测试程序。我的所有字典都是用这个程序打包,暂时没什么大问题。词条数最多我试过的简明英汉400多万词头;体积最大的OED,txt源码就有2.4G;这些打包都毫无压力。不过我这边还在用老古董python2.7;python3应该也能用,如果报错,可能需要自己debug一下。
4 ]7 B2 p% ~# o! |genMDX_ox4.py is the entrance file you want to use in CMD/terminal. I've also enlcosed a OALD4_azure.txt for testing purpose. 9 e/ R- @4 c( g8 ~; y) _& T2 @
- ~" x: p7 `1 Y
8 a |' }# v- T; f! f
1 G4 S: F/ I* Z& A+ f0 pWindows下运行举例(需安装python):
/ c8 n8 n! h3 g
4 @ t! Q6 u+ G+ n' Z
. P5 B$ P4 F5 G相较于原版我主要改了两个地方:) X# T* |! f* M" u( R8 j! f
1. 在代码里,以前一个字典的key只能对应唯一个value。而MDict完全支持多个相同词头对应多个意思。所以我改了代码,让一个字典的key可以对应多个value。
) J z H! i& m( w8 g2. 修改排序算法,原版是用的默认python排序,输出的文件在MDict简直不能查。GD勉强能查。
7 b8 L$ ?5 a' |5 \) j9 \" [ m/ s/ ^/ t+ w0 t
# y+ q8 a) ?% R( ^. R# L/ W) `; \7 [, T2 D m* z3 o0 P
Python实现的txt转MDX代码:
9 y4 L) y* o7 I, h: y$ Q% X$ d
: H* N7 [: J( j7 p3 Z( D5 O欢迎提建议+ _4 u! ]6 |4 U% }1 c2 }" k" b
⚜ 感兴趣可以看看我的其他字典,绝大部分都公开分享。
6 E+ E' e5 B6 m! t5 M" m9 z# u7 S% S
; l% Q0 L, S4 V1 x+ n) ~2 z
1 M' A( i5 N2 Z" _
( u" R+ z( |* R; I( K1 p) _ y' F* a2 q( V; a
. L( M4 l" p( \; S5 {6 z5 ]$ I% q8 W
9 G6 f- D. [" \0 r* h3 |
|
评分
-
5
查看全部评分
-
本帖被以下淘专辑推荐:
- · Top1|主题: 136, 订阅: 130
- · 超棒的词典!|主题: 44, 订阅: 45
- · 词典制作|主题: 217, 订阅: 40
- · lgmcw|主题: 13, 订阅: 35
- · 工具|主题: 61, 订阅: 28
- · 更多
|