|
本帖最后由 cdyg 于 2009-12-18 10:38 编辑
g( F& X0 e9 F2 W5 L4 S 6 ~; L4 Y8 ~( z( y
转换程序支持格式:
( }; Q" h+ ^ o9 c) a1) 扩展的SugarDict格式:* i9 ^4 X, q" z+ Q/ @, [, m3 _
每个项目(词条)一行,缺省最大为32K. 格式为: 关键字
# R; j$ J9 O! m# J解释(就是关键字和解释之间用空格分开)
6 h; M& @5 }8 A& e关键字: 可以是大小写的组合, 每个单词的最大长度是255个字符。' w. h0 r4 Y2 ^ u4 @8 H
关键字和解释中的'_', '^'在转换后会被替换成空格和回车
. s) V5 O/ z% ?4 k, b9 i5 I! s例子:
) Y! A* @& P& @8 h; A9 x5 \# I' ^break_through /'bri:k_MQru:/ ^v. 突破^n. 突破0 C& ^; l1 I! e" Z3 ]# O! F- `
good ^adj.好^adj.贼好^adj.好得不得了- G7 v; l2 D8 w# ]" s: c
2) KDict解码后的tab格式, l! A" ]1 O" M/ K
每个条目一行,关键字和解释之间用"tab"分隔. 其中的"\n"会被转换成换行
5 ]1 A' ?" j9 g) `例如:
# u/ q3 k. Q: `6 F |good adj.好\nadj.贼好\nadj.好得不得了
/ T1 m" ?# Q8 c3 [" U0 l$ ?1 F7 c5 w
3) MDict的html格式, n- o1 a8 `& x: K$ r
每个项目两行7 `% ]+ b# P0 V. |
第一行是关键字- [" S: g4 Z) r! a, b1 i/ @. h
第二行开始是正文, 这里的正文应该包括关键字。可以使用html的标记(不要包含<html>
3 S. h& O7 {) U" a7 i+ ?7 h<body></body></html>, 这个程序会自动加上, 另注意在转换时要指明源数据为html). . i6 g$ A8 U# ?5 d4 X- N& a+ x0 ^
如果需要显示音标的话,可以利用html指定字体就可以显示了。(参见下面的例子)
3 j! [3 A- m* r正文结束后必须用一行</>表示结束
$ ~! ]# q2 Y/ G& C( z5 }例子:
& {( S1 H r1 L4 LWhole
- y: d* j: p5 d2 e& q4 C. P$ \" L$ r<font size=5>whole</font>
5 u) d# J M7 B" n1 Q4 m) O" t* M<br>
% O1 b- [/ ?7 S/ M2 n% R% U. ~0 h: e, U<font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font> t0 s2 D+ b+ @+ h" H7 O
</>: {. |* `, K8 u
(注意"</>"和下一个记录间不要有任何其他空行,请参考example.txt中的例子)8 L2 v2 }8 |. }7 `! N" f
在html中连接到其它关键字的方法:
9 O! W! _7 g; ^" n ~<a href="entry://key#section">key</a>9 h: g8 h6 @) h- q) v3 d; r
其中key是关键字,section是对应关键字页面中的section名称.4 N* n" ~1 Y! w, r! w0 E
在html中嵌入图片的方法:(PC版的MDict不支持图片)
; Z: J/ k) L6 `- K<img src="file://abc.gif"> 或者 <img src="/abc.gif"> 其中src指向的文件名大小写不敏感1 d4 \) f7 N7 I0 ]4 B1 c: i" x
并将所有图片文件放在一个单独的目录中(不要与词典源文件放在同一目录中). 数据目录中可以( Y) q/ b7 x' v3 O8 [0 S
带有子目录。在使用MdxBuilder制作词库时,将Data路径指向上面存放数据的目录,该目录中的
3 [) e) _) k! c% [3 i所有文件都会被压缩到后缀名为.mdd文件中,使用时该.mdd文件应当与.mdx文件在同一目录下。0 N6 S$ V# r8 i6 ?- x& l
在html中嵌入声音的方法:(PC版不支持该功能)
1 A' r; F ^6 T W) _a)使用<bgsound src="/audio.wav"> 这样的形式,文件名的写法和保存方法和使用图片一样。
5 }' w- Q9 _. M8 _6 e* V$ lb)使用链接<a href="sound://keyword.spx">keyword</a> 这样的形式,点击该链接的时候可以进行发音 t8 z G+ I% {9 H
发音仅支持.wav和.spx格式的音频文件。
" ]! } v9 p! E, ?5 m/ S0 O! H# b4) MDict的紧凑型html格式(Compat Html)
8 i0 w% G% u8 X, q$ Q4 D这个格式由两个文件组成,正文文件格式基本和2)一样,但在正文里可以使用记号。另外# _" \3 _/ L( {7 Y' i2 |
一个是记号文件。5 C( C# J3 j/ n u7 j3 n @# X
记号文件的格式:/ B5 v+ A$ d" Z% B$ Q# q& Q
由多个记号定义组成,每个记号定义有3行
' O9 ^" Q2 Z+ _, D4 x第一行: 记号的名称(只能用数字,必须大于0,最大不超过255)
7 L5 v! Q' G8 \) [* k第二行: 开始字符串(可以为空)
& n5 u+ I, F# |5 a+ I1 d6 m. f第三行: 结束字符串(可以为空)
n! W" |$ R* l使用时在正文里使用`记号`(键盘左上角的那个符号)就会将后续的文字直到下一个记号前的文% b) a/ A) V2 ^, }- l
字用记号定义的开始字符串和结束字符串括起来。正文里如果需要显示` 则用"`"表示。内1 K3 d- m, d" U' q4 A$ J7 K
码应该和正文的一样(例如正文如果是用Unicode的话,记号文件也应该用Unicode)
) ?) F7 ?$ O" r6 ^& G例如:
4 W# {7 l6 q* C$ H记号文件:
9 | H( w' i! U$ i, V2 Y" N1$ n+ |# h; G2 W7 f+ s# w
<font size=5>9 L/ T W" Q* u* s6 T
</font>
( C5 A7 \/ [- [/ P- B2
. e3 b8 Z1 d0 N% F7 e4 j1 m+ H<br>
9 @: |) f: u3 s2 W" j9 b# Z3
3 ~8 F# S. b# @" [ R<font face="Kingsoft Phonetic Plain, Tahoma">! r' g! e. s, {! L( V
</font>
6 w- E9 k3 `% L, A- d4 }3 [" J' ^4 D" D0 u6 ?7 p* @
正文文件:
R/ a- e, a0 Xwhole
4 z. i1 p* g3 ~' N: \' D2 n8 e1 B`1`whole`s`2`<p>`3`(hol,hJl; houl). M; M6 {! p5 }
</>
" {3 [2 H1 N) V0 A' t- o最后在显示的时候就会被替换成; `5 d. W( W1 x$ ^$ }
<font size=5>whole&#%96;s</font><br><p><font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>
4 h$ p; ~1 k O: f备注:
$ q- S5 Y6 C7 j I" b: Q如果你的数据里含有国际音标,建议使用Unicode格式) x# z- V7 h$ q) b# ~/ m! m
(请参考http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm)
, c/ r$ @- M, R+ w) L, j1 Z将音标用对应的Unicode进行表示。这样只要用户装有支持IPA的字体文件就能够显示音标。
. G$ g8 z8 P+ P5 i(Windows里的Lucida Console就包含有IPA对应的字体) |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
1
查看全部评分
-
|