|
本帖最后由 ebdic 于 2016-8-3 17:32 编辑 ) w, ^$ @5 [7 I" Q2 {, g7 [' @
, u* V9 A8 U5 r" b% c4 c" |) X' N对于epwing的字条,EBDic会根据字典作分析。
' z1 [+ \3 J' D2 _
p) Q( w5 _! u1 W# b1 j
- z. C* s' z+ z6 C" m9 C; N例如:
6 ], H( x2 G9 G$ Q+ A' n小学館「中日/日中辞典」統合版 :
" u. r6 `4 g2 ]4 f: S+ f+ _' C) B; F" sはな【花・華】6 }2 k) x% H7 ]$ Q4 o) E$ m
2 P1 D5 X; H' l9 m+ p広辞苑第六版:
4 B1 g6 w4 d1 e/ F4 G5 f9 nはな【花・華】& \" E N! ]. q" v6 N% r! o; D/ U
$ H7 z/ U) R7 m三省堂 スーパー大辞林 :2 P* N1 w& a' K! @9 r
はな【花・華】
# N+ ^* A1 k8 J- [" l% A
5 \% O3 T/ o" L$ I& P9 n4 ]新明解国語辞典 第五版:
2 l6 h7 \* G$ }5 gはな【花】[2]5 V$ }8 W+ m) Y- [5 j6 C
7 r# B# c- Q% t* D, Y学研国語大辞典 :
1 o6 M4 \8 a9 h) {2 H Vはな【花・華】
0 {+ {! B1 K6 D) p2 q8 [- @8 U3 i* E0 p
講談社日中:
7 j6 I: _" W* ]& ]5 ~& b7 j【花・華】 はな
- D. V" I" j# ~8 A
3 T& l* W9 x6 `4 V' f3 o
* L) g" D; v$ P) I7 Y会分析成:
2 g% v# F& n9 {4 k/ D汉字:花; O- a1 [, c, L1 j8 \
仮名:はな$ @5 U6 k& l. ~
-----------------------------------------0 x8 ` Y9 ]% _
小学館「中日/日中辞典」統合版 :
' I" |6 I1 ~. Z, C) m: _はな【端】
. Y1 m7 c, Z9 f% s9 l ]/ [
" _8 ?- Y# v: Y& c5 B広辞苑第六版:
; G# i u, } o: B: t( V" |はな【端】
& ~4 Q$ p$ y$ N' K: x# Q5 ?+ ]6 z2 {$ C
新明解国語辞典 第五版:
' @ D* h4 i6 y+ Uはな【端】[1]' O9 F$ [7 L" g+ g: d$ \, X7 I
& }+ L c9 o8 N# V; t* ~学研国語大辞典 :3 @/ q; k0 `# F' N) Y- i
はな【〓端】4 A- r/ R( i3 J9 A P% b
4 [0 J* Q6 a( k7 M3 Y2 S6 U9 C
講談社日中:$ [. `5 M+ ^9 s4 }
【端】 はな5 |3 n' @3 U# e0 Z9 ^; h
% p, H6 C- E c9 }: f7 k会分析成:5 N; |3 y9 e. A1 h' @
汉字:端
w% _; s5 [2 b: I) j; ? p. m仮名:はな
. n1 D5 R: X. d$ l
" t- y8 G" ]' |- c6 _-----------------------------------------
% Z5 l- y$ U. J然后,发音的顺序是:& c: U( o/ [) n! i" ^1 `
1. 如果有Sound_ja.mdd
/ J% E! a4 K# C3 P' O, y先用汉字寻找,假如找不到,则以仮名寻找。
2 t* ~$ x2 B4 x$ K3 `
& g' w6 Y1 }1 ^- w9 `* |) k2. 如果没有Sound_ja.mdd或找不到,且如果有"NHK 日本语発音アックセント辞典"4 e) Z% q# K$ h) q( x
  a. 假如只有仮名,则使用仮名寻找,以仮名寻找到的第一个字条为主。
2 C. X0 p" I: r. x8 C! J  b. 假如有汉字及仮名,则会同时以汉字及仮名在"NHK"字典寻找,
2 `% v6 G' Q% t/ |$ H3 h     然后比对两个寻找的结果,如果有同一字条,则使用此字条。1 [: M/ b9 Q6 ]- k! X- H; f9 J8 |2 s
     如果只有汉字有字条,则使用汉字结果的第一个字条。( X# G0 ]; }" P+ c; [
     如果汉字没有字条而仮名有字条,为了正确的发音,这边不会使用仮名的字条。
" Z; H. a6 r; K( n2 p$ Y1 E
" I3 a, U' p; a! D3 ~: R     如果找到了字条,则以字条本文的第一个声音档做发音。
6 ^- v" G- Z, N \7 I' D# M1 K9 Z* Y/ \" W( `: c/ j4 |
1 J# W) w* x# S
3. 如果都找不到,则会使用TTS做发音(要设定TTS为日语)
+ s# e# r$ \6 z
" |7 ?0 G. }2 T1 F$ i" R-----------------------------------------6 p+ X P) b$ h5 o' w' R/ T: ]2 |
8 F, ?1 P ~9 d. y1 q- y6 W2 b感觉是使用"NHK 日本语発音アックセント辞典",会较精准。+ [8 U- I" w3 v6 E' G
但不能确定,因为我没有实际去做比较。 (有可能Sound_ja.mdd收录的汉字或仮名字条较多)
, O8 l- L8 x. Z如果有"NHK"字典,可以移除Sound_ja.mdd,则会以"NHK"字典为主做发音。
; D) N# o. U3 y& g1 {! |6 k' N
( H( V% J" x( @4 K7 L. z$ P! {, P4 T+ L1 U) O6 @. \
但有时候有些汉字的字条,有很多不同的发音,可能在"NHK"字典里本文的第二个或第三个声音档。& o. \% y2 k4 }0 U* J, q1 N) U
所以当发出不是认为的发音,可以去"NHK"字典做确认。
" E0 M1 g: \% M% u& R" t$ H/ G0 J W" w
例如:
; J5 ?' X3 M, q; d- J6 p& }紅葉 こうよう/ A7 ~* s" [* B4 n4 O" }
紅葉 もみじ
: g2 H' K/ c: m k, |. R" u; g-----------------------------------------
7 k, |; I, t, ^9 n3 v! f; A0 t# {% S& ~7 e1 m2 x* e# h
因为EBDic会根据字典作分析,所以是写在code里,7 z7 O+ m0 m6 J' e5 k3 E) d+ B+ _7 h
目前已分析的字典有:
9 i' Q) ]4 s: x4 a
2 C3 n) N7 \3 k小学館「中日/日中辞典」統合版 - a1 |6 b5 w5 R7 U* H! N1 \
広辞苑第六版4 u6 p3 v0 c# n0 h
三省堂 スーパー大辞林" f, k. n: G, B. V4 G
新明解国語辞典 第五版
' J# c/ W- |7 f- I学研国語大辞典
1 `/ [8 X, j& @/ @学研漢和大辞典" S, C3 s' l- s( b) w% g# d" s* E. ~
講談社日中9 K+ W4 L1 x: Y C5 `9 S8 N# z) _9 r
大辞泉
' n* L) b' a* h; ^! J5 r国語大辞典
3 J* i* p" ?1 m" o5 E3 a明鏡国語辞典0 f4 d8 e8 t9 g( u& j
8 M8 j" r$ Y6 [5 V
其实,目前的分析只做了一部份。( u/ K, D8 E; @' {$ t7 t+ _
有些汉字的表示法,可以有不同方式: X1 I0 A' a9 |% o9 f
例如:
' @7 |; R' P9 I4 c1 w K掛かる,掛(か)る, x1 [) P6 @* t1 o" K
如果是"掛(か)る",则会去掉(),汉字的部份变成"掛る",在"NHK"是会找不到结果。( a! @ C; r4 N* R% f0 t
& C; o) M) D: P( w; wEBDic目前也只以第一个汉字为主:
& M: {. D0 I* H% d$ h# [- c例如:, m5 S: c, T N
はな【花・華】, X; Z* U' e, @& n
/ `3 H' ~2 q. |# j会以"花"为作为汉字。2 b i6 q! r- H* C8 `) @( m
- i2 H w/ F$ M# D4 ]: O
" e' s; W1 C2 b& [1 v9 V# _另外如Wiki字典,比较像是百科字典,所以也没有考虑做为分析的字典。$ D/ E# |0 C M1 H
EBDic的汉字分析,也应用在手势的Exact Search或查询语的search,以及切换字典时的"跳至相同字条"上。
& @1 O9 n1 K6 o5 p( A, o----------------------------------------
" A# _: d. W+ j* f+ b
; V; L k9 G+ h1 ~' {, h2 I如果有发现字典的字条,没有正确的发音,- R; o; Y4 z8 f5 b4 m9 K
如不是因为汉字的表示法不同,
( [" S+ d8 Z- t- p! y n+ f6 K可以告诉我,字典的ID及字条的格式。- m$ e$ O3 b0 S# z; M" a) T8 G
(有些字典,真的会加一些自订的符号。目前主要是以NHK字典查询的方法) |
|