|
本帖最后由 cdyg 于 2009-12-18 10:38 编辑 8 U3 y5 B6 q- i/ v. K8 k
0 z" Y* Y& ~7 u( |, ]9 F6 `; i) i转换程序支持格式:
3 y- U( f' J/ @! p1) 扩展的SugarDict格式:
! R/ D: u- U, t5 F4 n* H: H每个项目(词条)一行,缺省最大为32K. 格式为: 关键字1 {: b+ {) _6 O3 k9 \
解释(就是关键字和解释之间用空格分开), k. j; y6 ?. d r
关键字: 可以是大小写的组合, 每个单词的最大长度是255个字符。, M1 w/ g# X5 v6 X8 z
关键字和解释中的'_', '^'在转换后会被替换成空格和回车
J" J7 s; C( i' K' Z' Y例子:& B; O2 p+ u- h' B
break_through /'bri:k_MQru:/ ^v. 突破^n. 突破! g0 C+ l! W# G( ~* t' e0 ~
good ^adj.好^adj.贼好^adj.好得不得了
: n5 o3 C" [/ K' S2) KDict解码后的tab格式0 w+ i5 Z% u# _2 c
每个条目一行,关键字和解释之间用"tab"分隔. 其中的"\n"会被转换成换行% J8 @0 L j3 I* j
例如:+ z+ s# E/ k8 o) Q
good adj.好\nadj.贼好\nadj.好得不得了
$ L( m; m- Z: c6 `6 b
$ l5 k2 j7 h) T/ r* b; Z6 S+ ]3) MDict的html格式& K( C9 V8 R3 K* x$ `
每个项目两行
) m- a1 u# f, g2 t( R/ P第一行是关键字& `6 }, K$ e1 T( I* @
第二行开始是正文, 这里的正文应该包括关键字。可以使用html的标记(不要包含<html>7 A% J5 {3 o4 `% Q( t
<body></body></html>, 这个程序会自动加上, 另注意在转换时要指明源数据为html). 6 I2 |: U2 b: G7 W: Q$ p. g
如果需要显示音标的话,可以利用html指定字体就可以显示了。(参见下面的例子)4 K4 ]7 W8 N. D6 y; P# l% j
正文结束后必须用一行</>表示结束
: b7 Y) p3 R' ?4 U" Z例子:
) H7 M c T6 Y/ v3 l& yWhole
8 b" S; X: G% N9 \" O<font size=5>whole</font>
- Q: M, a7 O$ s$ z<br>
8 }/ ?3 P9 E$ ~. ]% e<font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>$ T8 E6 h% @; Y! D3 @
</>* ]' @% t& d; [6 E5 G
(注意"</>"和下一个记录间不要有任何其他空行,请参考example.txt中的例子); N0 u, p* t& I
在html中连接到其它关键字的方法:1 U4 ^, z- w7 K3 V( _
<a href="entry://key#section">key</a>
5 @& Y3 H+ Z# n4 o/ k+ ?* Y5 |$ {其中key是关键字,section是对应关键字页面中的section名称.% D5 d* j8 h$ H: T
在html中嵌入图片的方法:(PC版的MDict不支持图片)8 n2 L, C$ d! d
<img src="file://abc.gif"> 或者 <img src="/abc.gif"> 其中src指向的文件名大小写不敏感8 e$ O. v$ k* r7 ~( f6 \6 _' x" d
并将所有图片文件放在一个单独的目录中(不要与词典源文件放在同一目录中). 数据目录中可以' K% Q) ~. [1 P! c( |: w
带有子目录。在使用MdxBuilder制作词库时,将Data路径指向上面存放数据的目录,该目录中的( o2 j9 F8 Z8 L( c; q2 _
所有文件都会被压缩到后缀名为.mdd文件中,使用时该.mdd文件应当与.mdx文件在同一目录下。" p1 E; L# |8 U1 T' s3 _. K
在html中嵌入声音的方法:(PC版不支持该功能). p7 M) A" F1 M- g. B6 O W
a)使用<bgsound src="/audio.wav"> 这样的形式,文件名的写法和保存方法和使用图片一样。# w! C. E+ q( x# l
b)使用链接<a href="sound://keyword.spx">keyword</a> 这样的形式,点击该链接的时候可以进行发音
+ m, k X& p% [9 n' _发音仅支持.wav和.spx格式的音频文件。5 l! u; B+ R( Q; h4 r; j/ e
4) MDict的紧凑型html格式(Compat Html)
4 ^- k, \0 Y+ a& u6 X这个格式由两个文件组成,正文文件格式基本和2)一样,但在正文里可以使用记号。另外
& w8 D3 {4 B! u( t. m+ g; S一个是记号文件。
2 l7 C7 O& k+ ^' T记号文件的格式:
7 [ m" E! E- _1 \5 R由多个记号定义组成,每个记号定义有3行1 c( u$ i9 ^1 M% m4 c+ \+ D
第一行: 记号的名称(只能用数字,必须大于0,最大不超过255)
$ I d1 o# [) S第二行: 开始字符串(可以为空)
3 ?% i) v8 g! K) A) H" B第三行: 结束字符串(可以为空)
( {, ~" i6 l$ T% o使用时在正文里使用`记号`(键盘左上角的那个符号)就会将后续的文字直到下一个记号前的文 y; D% I. r& K0 `8 q; J7 ^& V
字用记号定义的开始字符串和结束字符串括起来。正文里如果需要显示` 则用"`"表示。内
L4 i V/ p' L* u( G, \9 n- p码应该和正文的一样(例如正文如果是用Unicode的话,记号文件也应该用Unicode)( g% `: C, J$ _
例如:
0 |5 f; J, v# {9 x记号文件:
+ u4 G' o# ]9 R _; J3 z1
3 J! u8 I% s7 J# t- t<font size=5>9 ?* O3 p& s9 b; n& g3 j8 X
</font>+ j# K% Q8 \# e2 |8 y
24 R$ s N0 O9 K6 h- Q6 S# ^
<br>5 u" ~3 C- K o+ C
3# Q2 n( ~+ o D5 M+ e8 F) K1 |
<font face="Kingsoft Phonetic Plain, Tahoma">0 k! E2 @/ x: E, p' w
</font>% z5 k$ b) y9 z7 G" U# H# Q
/ y# r, w& v* }* ]
正文文件:1 u$ T) c. J& a( [& M3 Z7 {5 o/ t
whole# m" R+ w8 }% d! l% q
`1`whole`s`2`<p>`3`(hol,hJl; houl): o9 h, k4 z$ u7 g7 y
</>' D5 G- L* ?1 _8 s( E
最后在显示的时候就会被替换成1 L* o3 T) I0 @8 i9 G+ C) a
<font size=5>whole&#%96;s</font><br><p><font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>
% z: N7 G9 r% |8 g备注:# J5 Q5 i' }5 a* |
如果你的数据里含有国际音标,建议使用Unicode格式0 P5 n( O2 g; O" R# B) J
(请参考http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm), q8 Y0 J4 `6 U* r0 |" A
将音标用对应的Unicode进行表示。这样只要用户装有支持IPA的字体文件就能够显示音标。" ?6 q# R$ W# Y/ F6 q
(Windows里的Lucida Console就包含有IPA对应的字体) |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
1
查看全部评分
-
|