TA的每日心情 | 开心 2023-9-27 20:45 |
---|
签到天数: 847 天 [LV.10]以坛为家III
|
本帖最后由 nullname 于 2019-10-12 08:47 编辑 . S, F- Y- r5 R5 b, d# }
. E9 p# z+ t1 f
00
& W! H6 I! [5 P$ T: Q9 e( M7 z3 @3 m相较于MDX词典的百花齐放、门类齐全(从学习型再到母语型再到俗语习语俚语等,不一而足。) Kindle用的MOBI词典就显得冷落多了,有意义的词典非常有限,也许是因为Kindle的使用人数很少吧.... 基本就是官方的英英、英汉和 skywind3000 大神的这本 简明英汉必应版 了。# m4 z; K. d2 I: G# V1 T6 y
其他的像书伴上的那些都很难用,主要问题就在于不具备 词形变化 的查询能力。比如书中出现了 looked, raised 这种单词,它们基本都不能直接查询到 look, raise。 p, e8 L: V5 C% Q+ N
0 Q2 T) |6 T1 u6 C
之前在知乎上看见孙缓之的一篇帖子(见此 Kindle OALD9 民间发布(仅限交流使用)),可以用 dsl2mobi 这个工具来将 dsl 词典转化为 mobi,且具备词形变化的查询能力。但貌似 dsl 词典不是太好找。
5 f( P+ p. k7 o! a1 d6 a) ?5 T+ {, V% K6 u( F; K9 F, C
因此,想试试能否将 MDX 转为 MOBI。教程不多,仅在书伴上找到了这几篇文章。(请见 《如何把 MDX 格式词典转换成 Kindle 字典》,《自制 Kindle 字典简明教程(入门篇)》,《自制 Kindle 字典简明教程(进阶篇)》)
# N, n0 E+ w' c9 [0 I: u0 H, R, t/ o% H! U0 A ?' s
根据 《如何把 MDX 格式词典转换成 Kindle 字典》 这篇教程,转化出来的词典不具备查询 词形变化 的单词的能力。主要原因在于没有添加变化后的单词,如图红色矩形区域(更详细的请见 《自制 Kindle 字典简明教程(进阶篇)》)。
1 ~; G& W3 k" g$ }, S+ s, l$ c9 r4 D9 ^. s1 z6 z2 g
以 COED11 举例,这是转换后的 HTML 中的词头部分:
) c( ~& G& \6 I1 i+ j" S5 U. i! e! ?4 d9 i! v/ k. e* y
若要具备 词形变化 能力,需要的区块(红色矩形部分):4 {( ^1 \* Y) N" j
. S; v6 x; R% u) i: N8 {6 ~6 R1 [8 ]+ n3 g
" U) Q* Y8 l. b0 {' w
我抓破脑袋都想不出怎么样才能自动添加这些进去,后来想起 dsl2mobi 有这个功能,就下载下来研究了一下。该工具是 ruby 写的,基本看不大懂,不过我在其目录下发现了包含十几万英文单词词形变化的 TXT:/ L) n- e- ]& Q( p# F% {) {2 `' K
5 ~/ U5 N/ @3 Z
" U3 a b1 P- B1 K3 E/ o: b8 N' s! r! H4 U* Q
排列比较有规律,格式为 单词原型:变化1,变化2,变化3...... 因此用 python 写了正则批量查询添加:
5 R3 A& `- E- N% F) U2 ?/ i; f) @$ Y1 Y
0 n! o" p! \9 j1 i/ p: B
1 }2 ?$ \7 f- ~. A4 b' J跑完之后:
5 |2 H4 k. @+ V, P, c6 E+ G7 I" i, S1 S+ j: i# W
- Q6 d3 B8 a4 v3 N, ~ k: B3 [! ~/ U/ I$ z: s
基本原理大概就是从词典中取出主词条单词后再在 forms-EN.txt 中查询匹配,若成功则返回所有的变化形式并添加区块代码。然后重新生成 mobi 。9 Q! i) ]- _7 e; ]7 K3 N$ O4 d
2 u8 i3 c0 W5 g% Y; m% ~
兴冲冲的试了试,
7 [1 `, o4 X6 s# ]0 k' l0 v
9 m# [/ M+ e& R# l* i9 T5 L3 { 两个看起来都没什么问题,和我们想想中一样。: J. W! @/ d ?4 p9 W5 s
: p* j1 X5 @7 I( @- J8 s
再试试,3 I4 n4 t/ }( x- v4 F' {
9 R& @+ q% v$ v) q
查询dealt的时候,按设想,应该是查询deal才对,结果并不是。
& A7 l i/ L$ T. H8 }7 Z$ y6 {4 E/ _* Z1 i
用官方的词典试试,
5 B5 ^6 _0 }' Z: A
0 [ P n7 W+ C4 g0 v1 O同样如此。 V* R6 c4 G0 M' O9 Z( |9 |
3 k; ^4 H; s7 T) k0 t3 @7 ]0 L# N$ {" f% P
2 B* b- p7 W' k! o9 E2 ~. h
01
5 }7 c" X& @8 C( d( b# H+ b3 m( n( @
后来经过反复试验,发现了 Kindle 的查词逻辑:选中单词后,查询主词条是否匹配成功,成功则返回对应的条目,同时不再继续查询变形词条。没有主词条的话则查询词形变化区块是否有匹配,若有则返回变化词条的原型主词条。2 a& d" W o: |3 [, [1 K: P- g+ P
$ @ h: X9 D3 Y8 `* Xdeal 的词条部分已经添加了 dealt 作为变形词条,然而我手中的这版 COED11.mdx 和官方的Oxford Dictionary of English 都有了 dealt 这个主词条,词条内容如上图。因此不会返回 deal 词条的内容。, R0 L8 W" y; b
5 B+ s$ ?5 N# c2 I. W3 L
知道问题所在后,如何解决呢?想了想,很难,因为英语词义太丰富(Rich)了。比如flame,它的词形变化理应有flaming对吧。但是flaming本身可能自成一义(火爆的,讨厌的,该死的),如果查询flaming的时候跳转到了flame,从flame很难猜到flaming的一些专有词义。除非亚马逊更新固件,修改上述的查词逻辑,即不论查不查的到主词条,变形词条所在的原型主词条一并显示。不过目前看来希望渺茫。
8 I9 B) a0 h* Q6 F( U0 G6 S% l+ J: @4 m
* V2 l6 N& N& a) T$ m. [% [02+ u Y, G+ S! g9 v
即使如此,还是有许多优秀的 MDX 词典值得页应该被转化为 mobi 以供大家使用的。个人认为kindle上不适合使用学习型词典这类词义较少的词典。比如你在看书的时候看到了square这个单词,假如你用牛津高阶,你翻到底都翻不到“步兵方阵”这个释义,最后陷入深深的自我怀疑...然后又去提问“为什么我每个单词的意思都看得懂但是就是读不懂句子的意思...”。! L4 i$ t) d: L- ^+ B3 [
1 B2 y+ x# ~4 m/ \7 a经过一段时间的试验,我发现 The World Book Dictionary 和 Microsoft Encarta Dictionary 这两本词典非常适合“高阶有余,母语不足”的英语水平者的使用,但把它们转成mobi难度略大......由于水墨屏的特性,kindle 上词典个人以为只需要1.粗体 2. 斜体 3.浅色 这几种样式即可,不要图片、音频。同时要求css内置在mdx中,不能外挂。在此也向各位请教如何将外挂的css内置进mdx中的方法,我尝试了在html中添加style标签然后将css全部复制进去,但似乎并没有效果?各位如果有较好的适合在kindle上使用的词典也可以发出来大家尝试转换。6 G# b+ H g* t i
( m' {6 F- W. }6 ^+ H
写的比较乱,抱歉。也欢迎大家交流讨论和指点。
# S" [( y* t8 I J$ C6 q# F5 f7 e4 B4 v
K$ b7 r& `) M5 |- g! y* c. m) j
最后附上制作完成的COED11th.mobi- h" i: [* f$ _
C! Q& x1 Z8 t5 u- C5 `
! K V! l& f! D; ?4 v; S链接: https://pan.baidu.com/s/1TyMK4P1A6ltCEDr2Bt_rNg 提取码: zp3b ) k! F2 ?9 i4 O/ N; X
3 k; _* ?9 E6 K5 H2 b
----------------------2019.10.12补链----------------------
0 L8 @8 h' K0 s1 i2 @" y3 J- q8 \链接: https://pan.baidu.com/s/1bSRfcScur482utaLmsxOgg 提取码: 4b5h; Q/ g! T5 F. t0 c
! m; P% g8 i2 F6 [! F# p- @1 Y2 @0 ~) Y; \9 x/ n
! G0 n9 d! Y# l( K
4 K0 P8 R% _) E
: o4 s% M0 C$ @5 i: S
# n' e& r; ]4 |; |1 X
+ d# Y- d8 _8 J( F
' n9 T# Y0 B( z( G6 z
1 n7 J+ ^& ~) r: ]% Q7 k, t `, b0 Y$ K( U
1 C4 K! z! G* A
! R$ e# T0 Q$ C |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
3
查看全部评分
-
本帖被以下淘专辑推荐:
- · 词典制作|主题: 217, 订阅: 40
- · 词典制作|主题: 111, 订阅: 24
- · 语言态度|主题: 150, 订阅: 19
|