|
发表于 2015-9-14 15:07:11
|
显示全部楼层
本帖最后由 meigen 于 2018-3-7 17:26 编辑
: e" \* P+ p& i6 U/ R( r1 b6 fbt4baidu 发表于 2015-9-13 12:40; S; W2 T% o4 Y% t+ A
何出此言?
) h! `" r, Q% c3 A1 g作为一个词典格式,肯定是参与的人越多,质量越来越好的+ w) c4 {# F1 _& H( S* Q! C
根据现代复杂系统理论, ...
9 Q' W. U1 c: e% e' e7 W3 U4 D
, V. p* k }. d! F重新编辑下帖子,mdx在2.0之前词条顺序是打乱的,为了检索嘛要进行排序,然后正文也跟着乱了,也就是说从文本到mdx这一步是不可逆操作
$ f7 I" I6 |( T之前有dalao说mdict可以像读词典一样,从第一个词头读到最后一个词头,但是……你可能读到的是假的辞书顺序
! W) B5 E3 d; x1 ?4 N3.0的顺序不清楚,毕竟还没人解出格式结构
- K: ~) `2 |6 `, z
3 C* Z9 o; q3 y& w3 \3 C: |! o& b* p说完正文再来说索引机制,不知道各位在编译mdx的时候有没有注意到词条的排序方式,没错,只是把英语字母忽略大小写就完事了,其他字符仍按照Unicode顺序排列,
6 \# V: k3 l: B# e/ C也就是说希腊字母俄文字母霓虹假名汉语汉字等等全部都不能看,法语德语西班牙语只要带有修饰符的拉丁字母一律排到z的后面,
% k2 S% d$ V: t, I, t3.0看起来好一点,对于字母词条是排序正确了,但是汉字还是不行,霓虹语一个汉字十几个读音,这个没办法排正确
, L0 M: \9 |- X: \. F
. q7 L. t- a( I5 j4 O- G- g* t: d7 repwing的特点在于索引机制和按照辞书条目顺序显示,比如输入“ある”或者“有る”,它都会跳出一个词条“ある【有る】”,做到假名与汉字同显,GoldenDict对于mdx索引做的也比较好,只需一个词条即可查到假名或者汉字。但还是有bug,有个别汉字词条查不到,只能另建索引。& T) G2 O0 N) q5 C* I+ |
4 h8 h$ Y: U! ~- R# _$ C9 I
关于上面几个问题,我想软件能解决的就是词条搜索方面,比如最近GoldenDict出的转写功能,而对于辞书原始顺序等问题还是无解。软件质量越来越好是没有错,就好像那个转写功能可以使平假名片假名都能通搜了,只要不是词典格式本身的硬伤其他都好解决 |
|