TA的每日心情 | 开心 2023-9-27 20:45 |
---|
签到天数: 847 天 [LV.10]以坛为家III
|
本帖最后由 nullname 于 2019-10-12 08:47 编辑
6 m" X. r% N# q" d, ^3 Z0 M! G( z3 V
B# D* G5 Y3 |5 I, o00
6 R0 |5 \2 g. _4 T相较于MDX词典的百花齐放、门类齐全(从学习型再到母语型再到俗语习语俚语等,不一而足。) Kindle用的MOBI词典就显得冷落多了,有意义的词典非常有限,也许是因为Kindle的使用人数很少吧.... 基本就是官方的英英、英汉和 skywind3000 大神的这本 简明英汉必应版 了。
3 } `$ D( J ?其他的像书伴上的那些都很难用,主要问题就在于不具备 词形变化 的查询能力。比如书中出现了 looked, raised 这种单词,它们基本都不能直接查询到 look, raise。- e8 M+ S) v0 n3 l
$ v* w. c, t9 q9 U* s, k) q
之前在知乎上看见孙缓之的一篇帖子(见此 Kindle OALD9 民间发布(仅限交流使用)),可以用 dsl2mobi 这个工具来将 dsl 词典转化为 mobi,且具备词形变化的查询能力。但貌似 dsl 词典不是太好找。) [ B( C$ Q4 b0 L! ^
& ~8 `1 P! k0 M因此,想试试能否将 MDX 转为 MOBI。教程不多,仅在书伴上找到了这几篇文章。(请见 《如何把 MDX 格式词典转换成 Kindle 字典》,《自制 Kindle 字典简明教程(入门篇)》,《自制 Kindle 字典简明教程(进阶篇)》)
8 f4 }4 t; f/ g; b% Z
; s6 l8 R# w( y" F6 M7 x根据 《如何把 MDX 格式词典转换成 Kindle 字典》 这篇教程,转化出来的词典不具备查询 词形变化 的单词的能力。主要原因在于没有添加变化后的单词,如图红色矩形区域(更详细的请见 《自制 Kindle 字典简明教程(进阶篇)》)。
' }' A C: b, R$ E1 l/ V, P2 P" R8 V( L! l9 [3 u1 C2 Q$ E
以 COED11 举例,这是转换后的 HTML 中的词头部分:
r4 x* Z% F/ t% A) S5 y' g# q
: v1 n; q3 s, S2 }$ U3 ~) D$ Z若要具备 词形变化 能力,需要的区块(红色矩形部分):
+ }1 _0 f2 V- Z8 ]$ Q7 u! v% h( B% B1 X" h- S I$ ]5 f% f
, ~2 J* i! p3 @4 s, Z( E+ @. j5 f5 _( x. u
我抓破脑袋都想不出怎么样才能自动添加这些进去,后来想起 dsl2mobi 有这个功能,就下载下来研究了一下。该工具是 ruby 写的,基本看不大懂,不过我在其目录下发现了包含十几万英文单词词形变化的 TXT:
& e1 T' F* J( |/ m0 J7 x1 @+ U2 X" H( Q6 V
5 h/ j+ b' R3 Q3 k2 }/ E7 |
( D/ l2 _' e* N2 I. j0 R: Y
排列比较有规律,格式为 单词原型:变化1,变化2,变化3...... 因此用 python 写了正则批量查询添加:, S2 W" S% e7 v3 o* R
$ o+ O7 A) x: x0 y5 Q R q) k5 { V7 C' `3 N( X
. }8 `2 s [1 U+ I$ I跑完之后:5 W* c" x) _5 `( r+ `6 k
2 ~4 u6 g% r0 O. W; ]- @% v- u$ j
' s; A& Q3 f& B; D* u/ S* c0 S6 C8 U3 h0 s$ _
基本原理大概就是从词典中取出主词条单词后再在 forms-EN.txt 中查询匹配,若成功则返回所有的变化形式并添加区块代码。然后重新生成 mobi 。
3 v! L$ A( R6 g C# e2 i* y* n4 R" F! H0 M; g5 I; w( b
兴冲冲的试了试,1 @1 ]" z/ n) g6 d. \
+ p/ Z7 f& C! m6 f. }
两个看起来都没什么问题,和我们想想中一样。
6 x' Y, K0 K9 e% N% O( @7 O, N1 d n& L( m
再试试,
$ @9 d% |2 O" Z1 n1 n: F0 Y
7 [, J+ U4 \8 a6 {7 m* I 查询dealt的时候,按设想,应该是查询deal才对,结果并不是。
$ _" L2 E* s N8 N: _# w/ L& q) d) V8 D; `( f
用官方的词典试试,2 V- J U: H. Y* Q7 `. V
5 o6 ^; D, t9 ^) F7 Z5 a同样如此。/ O* U# ?% \' {" _
, k- _/ G8 x/ }. @' Y; |# [) X
% {' [2 r' c" O" S. z$ m9 @, Q) J$ \/ p8 N* J& F, g8 ^ l
012 m" o; ~" J h
* Z) R; P' t, T- P6 _: V3 h, k
后来经过反复试验,发现了 Kindle 的查词逻辑:选中单词后,查询主词条是否匹配成功,成功则返回对应的条目,同时不再继续查询变形词条。没有主词条的话则查询词形变化区块是否有匹配,若有则返回变化词条的原型主词条。
+ b5 H) P3 B$ Q' U6 ^" N3 c& J+ k1 x, l
deal 的词条部分已经添加了 dealt 作为变形词条,然而我手中的这版 COED11.mdx 和官方的Oxford Dictionary of English 都有了 dealt 这个主词条,词条内容如上图。因此不会返回 deal 词条的内容。
6 {$ _5 d3 t1 u8 q" {& [# o' y7 i# I# f+ ~7 |
知道问题所在后,如何解决呢?想了想,很难,因为英语词义太丰富(Rich)了。比如flame,它的词形变化理应有flaming对吧。但是flaming本身可能自成一义(火爆的,讨厌的,该死的),如果查询flaming的时候跳转到了flame,从flame很难猜到flaming的一些专有词义。除非亚马逊更新固件,修改上述的查词逻辑,即不论查不查的到主词条,变形词条所在的原型主词条一并显示。不过目前看来希望渺茫。- v: v+ u2 z2 j; C* V( Q
2 `$ s B1 u( e" H3 x6 [7 } J
) |7 w5 P0 h5 Y& Z+ `$ E' @02+ {* L' z# d! r0 A- _+ h1 ~& R
即使如此,还是有许多优秀的 MDX 词典值得页应该被转化为 mobi 以供大家使用的。个人认为kindle上不适合使用学习型词典这类词义较少的词典。比如你在看书的时候看到了square这个单词,假如你用牛津高阶,你翻到底都翻不到“步兵方阵”这个释义,最后陷入深深的自我怀疑...然后又去提问“为什么我每个单词的意思都看得懂但是就是读不懂句子的意思...”。; H% v, w( N, D/ t, v: G2 b& k
, @( G4 u+ N: [9 U9 _( o6 h经过一段时间的试验,我发现 The World Book Dictionary 和 Microsoft Encarta Dictionary 这两本词典非常适合“高阶有余,母语不足”的英语水平者的使用,但把它们转成mobi难度略大......由于水墨屏的特性,kindle 上词典个人以为只需要1.粗体 2. 斜体 3.浅色 这几种样式即可,不要图片、音频。同时要求css内置在mdx中,不能外挂。在此也向各位请教如何将外挂的css内置进mdx中的方法,我尝试了在html中添加style标签然后将css全部复制进去,但似乎并没有效果?各位如果有较好的适合在kindle上使用的词典也可以发出来大家尝试转换。
/ G# _+ D* E7 V' ` R
& z* A" ]2 E9 o' F& a2 n写的比较乱,抱歉。也欢迎大家交流讨论和指点。
* A! [- S2 o* D1 ^6 Q* r- v8 U
6 G) b: k% o0 d
9 N, D, q* L9 H) z. n3 |: E0 X最后附上制作完成的COED11th.mobi6 A, Y! n8 w' b, b, s. @, l
* T+ e7 W+ o7 f8 e8 }: \
) F; R2 ~$ X, c5 l; s' ~. L链接: https://pan.baidu.com/s/1TyMK4P1A6ltCEDr2Bt_rNg 提取码: zp3b 0 B ^6 r) r# u3 m6 F# b3 x
$ [" Z) u+ Y! l; }* ~( G
----------------------2019.10.12补链----------------------- h8 R- [$ b3 V# Y7 B- q
链接: https://pan.baidu.com/s/1bSRfcScur482utaLmsxOgg 提取码: 4b5h
" Q9 Z% ^+ l$ u( n" R" j/ e/ X' R' X' o. j
! g) p2 D+ X% |& q/ E5 |
$ q" z( j! a1 u" N9 o3 j6 R. ~% h" d1 w3 ^3 f# t8 z$ I$ H
: X# x8 y3 h8 {3 V
/ Z R1 u4 |/ b7 A' M& m* _8 Z: y6 z [/ `: ]/ u. U: b
( W" r! p( q! S! I
c+ o+ H3 j I& z' ~3 B
; O# T. L1 K0 T \4 [0 n% E, C0 ~- f* o5 Z
" g, E7 s; ~9 r: ?
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
3
查看全部评分
-
本帖被以下淘专辑推荐:
- · 词典制作|主题: 217, 订阅: 40
- · 词典制作|主题: 111, 订阅: 24
- · 语言态度|主题: 150, 订阅: 19
|