TA的每日心情 | 奋斗 2020-11-15 11:37 |
---|
签到天数: 249 天 [LV.8]以坛为家I
|
本帖最后由 lgmcw 于 2020-11-19 22:31 编辑
* h/ b8 z( d. y0 z' m% t+ W. ~$ K0 q) `( M3 M
这帖target的是硬核玩家,希望对有需要的人有所帮助。代码比较乱,拖了好久都懒得整理,正好朋友又找我需要,趁着一鼓作气整理出来就正好也贴在论坛里吧。我这里不跟进你那边的环境调试了,如果有运行错误自己修一下(python3可参考楼下的修改经验);不过还是鼓励回帖反馈。对我以后做新人友好版有帮助。
K, R- F! H1 G" R以后我会做一款带GUI的,针对小白玩家。% l* }* s* U3 H/ a9 E$ T
- @7 Y8 l: W$ A- [入口文件,运行genMDX_ox4.py即可开始打包,附了一个牛津4的txt源码,我已经调试好,确保在我这里能工作,下载后可以直接运行用来测试程序。我的所有字典都是用这个程序打包,暂时没什么大问题。词条数最多我试过的简明英汉400多万词头;体积最大的OED,txt源码就有2.4G;这些打包都毫无压力。不过我这边还在用老古董python2.7;python3应该也能用,如果报错,可能需要自己debug一下。5 k6 K8 _) k' I! e2 H
genMDX_ox4.py is the entrance file you want to use in CMD/terminal. I've also enlcosed a OALD4_azure.txt for testing purpose. ( z" i. F3 ]/ U" D6 q5 o- H; @
8 r _. Q$ e4 L( n% L z
/ j$ y4 o f. s7 Z, }2 g
4 g' F3 C' m% H% i8 eWindows下运行举例(需安装python):
& x! V# P# w0 \0 _9 [- b/ d% b4 n& Z+ ]! I
9 p* S( v T& P, U8 }8 Y# k, V0 c相较于原版我主要改了两个地方:8 v; C- ^9 g- A: O+ S
1. 在代码里,以前一个字典的key只能对应唯一个value。而MDict完全支持多个相同词头对应多个意思。所以我改了代码,让一个字典的key可以对应多个value。8 w: T9 N' C6 m9 B. ~/ G
2. 修改排序算法,原版是用的默认python排序,输出的文件在MDict简直不能查。GD勉强能查。
% P, h7 g7 V% `, a' @
; ~2 o, C9 q* t# z! i7 l, |$ C3 C+ U) T2 q; ?2 b
/ i1 s- L! P2 v+ L% x9 b
Python实现的txt转MDX代码:
9 c& @1 M+ C+ w6 n3 o
6 B7 s5 `& @: S) }" n欢迎提建议
* _+ R. ]. N. r! M⚜ 感兴趣可以看看我的其他字典,绝大部分都公开分享。
& B& [/ Y: q- n' Y0 U; ^( N9 I7 e9 i6 U
" D& ^' R) l0 Q, K+ ^0 Z1 I& y9 e V) T& ^! _! I5 a- t3 h
" M( D4 V0 X6 M% T G; Q
4 }) C1 r( T' D6 h, Y# F y0 x
% X3 ]6 u: }% {. e |
评分
-
5
查看全部评分
-
本帖被以下淘专辑推荐:
- · Top1|主题: 136, 订阅: 130
- · 超棒的词典!|主题: 44, 订阅: 45
- · 词典制作|主题: 217, 订阅: 40
- · lgmcw|主题: 13, 订阅: 35
- · 工具|主题: 61, 订阅: 28
- · 更多
|