TA的每日心情 | 奋斗 2020-11-15 11:37 |
---|
签到天数: 249 天 [LV.8]以坛为家I
|
本帖最后由 lgmcw 于 2020-11-19 22:31 编辑 ( D- N; X# N/ r+ d1 t# u& \9 A
1 W) H8 f* [6 u# C这帖target的是硬核玩家,希望对有需要的人有所帮助。代码比较乱,拖了好久都懒得整理,正好朋友又找我需要,趁着一鼓作气整理出来就正好也贴在论坛里吧。我这里不跟进你那边的环境调试了,如果有运行错误自己修一下(python3可参考楼下的修改经验);不过还是鼓励回帖反馈。对我以后做新人友好版有帮助。. B. \1 M; k! e# e. m
以后我会做一款带GUI的,针对小白玩家。 G, G7 x) P9 v( |5 ~% U
7 G& x' z- v/ x. x
入口文件,运行genMDX_ox4.py即可开始打包,附了一个牛津4的txt源码,我已经调试好,确保在我这里能工作,下载后可以直接运行用来测试程序。我的所有字典都是用这个程序打包,暂时没什么大问题。词条数最多我试过的简明英汉400多万词头;体积最大的OED,txt源码就有2.4G;这些打包都毫无压力。不过我这边还在用老古董python2.7;python3应该也能用,如果报错,可能需要自己debug一下。
' l* f( D Y( p; AgenMDX_ox4.py is the entrance file you want to use in CMD/terminal. I've also enlcosed a OALD4_azure.txt for testing purpose.
4 @$ `0 @, x$ `: v1 \0 J
# y( ~/ }8 F7 j+ X5 a' E& i _& Q5 P6 ]2 P" u: x
4 w) q$ m: i, Z% L. c, y3 h% kWindows下运行举例(需安装python):
1 a y, X. k8 A$ s! N9 U
, W8 a: T& G& ~3 H" e! v$ i2 p- r! f7 A1 U
相较于原版我主要改了两个地方:. _: ^' v+ U! f; A7 M/ [- V
1. 在代码里,以前一个字典的key只能对应唯一个value。而MDict完全支持多个相同词头对应多个意思。所以我改了代码,让一个字典的key可以对应多个value。
* Z# y) g e- R2. 修改排序算法,原版是用的默认python排序,输出的文件在MDict简直不能查。GD勉强能查。
. G8 E2 v5 d& t& V( t" I( X E" J; C$ N/ W9 P' N4 m( y
; o4 g" D% F9 K' [$ O. w
V7 O8 r/ h; u
Python实现的txt转MDX代码:
% X9 l1 |5 G( K- }- L3 @# M+ K; F d) X/ H
欢迎提建议
$ S& [& s6 E. H6 c" [: u⚜ 感兴趣可以看看我的其他字典,绝大部分都公开分享。
+ @ F7 R% S, V: i# p' c" u$ l
" _8 Q3 S$ v& @4 `9 n: L, \9 c! L$ S1 L: z$ q' g' J' c5 ^6 ~
' j& Q5 S# R0 A% y; Y
2 }$ E' I- f% s* k9 A9 N
- Q% K$ j/ L% j4 N' V; E$ M% i( A; e9 A0 H1 k4 ?
|
评分
-
5
查看全部评分
-
本帖被以下淘专辑推荐:
- · Top1|主题: 136, 订阅: 130
- · 超棒的词典!|主题: 44, 订阅: 45
- · 词典制作|主题: 217, 订阅: 40
- · lgmcw|主题: 13, 订阅: 35
- · 工具|主题: 61, 订阅: 27
- · 更多
|