掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 2987|回复: 4

[教程] 揭开EPWING制作的神秘面纱

[复制链接]

该用户从未签到

发表于 2010-1-17 14:50:23 | 显示全部楼层 |阅读模式
下面的一篇文章比较详细地介绍了EPWING化词典地制作过程,在看这篇文章之前,我自己曾经尝试过PDIC一行格式地制作。(PS 文章属于转载,属于本论坛天照大神地BLOG里面地)- _+ X/ l5 _" x  f
一. 准备软件介绍
0 E( q: Z, \" v% a; K1. Ebstudio ,epwing词典生成软件,最好是注册版。我这次用的是1.69。
! n8 q: t& M$ u- M2. c2epw02.exe,要安装版本,好生成需要的gaiji.xml、complex.xml、gaijimap.xml,生成的执行文件名为C2EPW.exe,需要在命令行下运行。
$ Q: V: z) C6 y  L3. 中日对照txt术语文件。本来可用PDIC(unicode版本)的中日dic文件转换为Pdic一行格式,但此次我没转换成功,可能是版本(词典文件版本、pdic版本、OS版本)兼容问题。应该还是能解决的。 1 {5 D4 U; x% ^3 t/ z+ S5 i
4. 英日对照格式txt术语文件。 6 T6 `: \7 Y5 k) R$ y( _5 D
5. 日文操作系统,主要是避免乱码和莫明其妙的问题。我用的虚拟的windows 98。并且安装好上述软件。
" m& D5 f, F0 m. f7 p
8 `# `* U1 s# U; {  t& I& h( u二. 制作英日epwing词典
# R; s- v, a, C' Y1. 按Ebstudio要求准备text文档格式。我采用的是对照格式,这种资料最多,如果为一行格式或csv、其他trados、babylon、stardict格式的导出text文档,则需要相应处理,可利用宏。
$ D2 Q* E0 B! F0 x4 L$ g0 h• PDICテキスト形式は、見出し 1行、説明文 1行の繰り返しで一つの項目を表します。 9 D; Q5 e# T! r( n
【例】
& x4 `- R4 P5 s, U8 \% m' pAutomatic Data Acquisition + Z7 Z1 a7 _3 v
自動データ収集
* y# `5 e: Y+ s2 ?Automatic Data Processing
, I% }+ i( N$ b7 N+ W自動データ処理
1 E+ E! y. m, B$ h+ M% `3 j7 b7 j8 @' G8 P
2. 打开Ebstudio,按步骤进行。 . R3 Y' z" E' r5 D) b
指定文件为准备好的text格式文件,选择pdic text形式。
6 |2 W6 t( c+ |; r4 K1 [- f' U/ }* o* p# \- p; W4 v; y
其他按要求指定,选定各种index后执行。生成词典文件(两个,一个catalogs,一个词典文件)。将生成词典拷贝粘贴到EBWIN词典文件夹目录下。搜索例子图片如下。
; B4 h9 h1 P0 y! j, v日文检索 8 W, ^7 I) ]. g' M" S& `

8 Q0 j. t2 H- B1 v+ N% A$ E  Y1 n
英文检索
; Y8 U  z$ b2 N* P( @5 b, y- c$ j* `: j% ^$ D7 z& r
6 u$ `3 l' O1 G) z1 ~
词典information如下:
6 i. r$ t* F2 W; M- o* w
! G. M5 i. n( L2 l* D8 v, k) @
# s* V9 c( S) P( d/ p三. 制作中日epwing词典
* Y1 ^+ y1 ~( o* Q; E5 P# w) {1 {1. 准备text文件。c2epw02.exe要求的格式为: 9 Q% v' j! T5 Y
( G9 j# a1 S& Y6 o: ^
辞書をキスト形式に変換
( m* F2 ^. q3 y8 S* n1. 対応するファイル形式:
8 g/ E- `: l; K5 v PDIC一行テキスト形式(ただし、文字コードは、UTF-8) 9 `) A# X9 [( b- \9 \7 W
  简体中文 /// 訳語部(ピンイン) \ 用例部(語義1) \ 語義2 \ ... 1 z$ [, @  e) a3 C& q1 O% d* {
2. PDICU(ユニコード)の中国語辞書を、PDIC一行テキスト形式に変換する。
! o' z: ]6 N4 b# C# @ Tools → 辞書の変換 → [転送元]PDIC形式 → [転送先]1行テキスト形式
/ J- I; m: u% K6 O3 \/ c* _# ]" n設定はデフォルトのままとして変換・保存する。(見出し区切りは [░///░]、改行は [░\░]、登録項目は [訳語部+用例部]、デフォルトの出力コードは、UTF-16。ただし、"░"は、スペース。)   u0 S  [+ @0 e0 C. R
 (例)u16.txt
. R3 Q# ^6 \+ s% x3. メモ帳(W2K, WXP)や秀丸エディタ等のユニコード対応のエディタで、UTF-16 → UTF-8へコードを変換し、名前を付けて保存し直す。 6 l; t7 ~- Q8 `4 o9 k
 (例)u8.txt
* `! p+ V4 o" m- O; U
4 y8 n1 e1 P* S  u4 F) |  Q这里因为我转换pdic的dic词典文件为text格式未成功,所以自己另行制作了一行text文件,格式(词条和释义分隔符░///░、)、编码(UTF-8)按如上要求。
8 r" b0 _+ m" q. |& }9 @例子如下:(拼音用括号跟在词条后面,未注拼音的是我测试用的。) * d! U( n5 f6 J4 v6 ~
良药 (liangyao) /// 良薬 /         
% T9 w! p0 [& ^) A4 `特效药(texiaoyao) /// 特効薬 /          9 M* ?0 K" T% V/ J% R8 e8 ]6 i. r
中药 (zhongyao) /// 漢方薬 /           ; Z. _! V- W" J' x7 r  X5 ?; J
内服药 (neifuyao) /// 飲み薬 /          
1 p; ]1 l5 L6 C+ F- q外敷药 /// 塗り薬 /       5 l6 |' `7 x$ R$ o% B8 C
感冒药 /// 風薬(かぜやく) /           ! C3 C* a6 L8 V1 E* U1 W# Z
退烧药(tuishaoyao) /// 解熱剤 /げねつざい   / m) p4 v7 e0 Q8 o1 }$ ]+ D. C
镇痛药(zhitongyao) /// 鎮痛剤 / 2 N3 U4 S. H# }, J

4 o! J# Z' _; W* UEBSTUDIO可处理的pdic一行格式要求如下: * S/ O! z4 \+ n+ `% \% `* D1 M
• DIC1行テキスト形式は、英単語、日本語訳、用例が一行で表される形式です。 PDIC以外に、PDA系の辞書検索ソフトで利用されている例があります。   w3 ^$ q9 ]/ m1 x0 A2 v  v) Q
【例】 - d& _7 P9 l. _/ e- F% W- I0 |
英単語 /// 日本語訳 / 用例 6 E9 j  A8 v4 T2 o" ^; q! b
• 英単語と日本語訳の区切りは /// (半角スペース+スラッシュ3つ+半角スペース)です。 / m( w% n* r2 l  R  ]
• 日本語訳と用例の区切りは / (半角スペース+スラッシュ1つ+半角スペース)です。
0 J% S* f1 ~* a7 i5 k, K% E* z• 日本語訳、用例には改行コードを含めることが出来ます。改行コードは \ (半角スペース+円マーク+半角スペース)です。なお、英単語には改行コードは使えません。
% W( [8 m( ?) g• /// の左側の文字列から、前方一致・後方一致・クロス検索インデックスを生成します。ただし、かな検索インデックスは作成できません。複合検索はPDICテキスト形式に準じます。 4 D9 J6 N- Z! s3 v
! v, W: L3 \  }7 H1 }7 Y$ ]
2. 按c2epw02.exe要求将text文件拷贝粘贴至与其同一文件夹内。在命令行模式下运行程序,生成html文件。
6 ]" t" {  o5 Q: E
' M5 W$ H( l: V  F. A9 }' q+ g( z- Z
生成html文件内容例子如下:
6 J/ _3 x# o! S4 @- w外敷药
' d" c/ A7 Y& n3 h0 B2 |<塗り薬/      > &#9418;
' \2 F& U; O0 i0 m塗り薬/      塗り薬/      5916 6577 836F外敷葯 + {4 Q4 U2 u% ]! `8 _3 r
感冒药
% u5 T. `8 K4 z' L, m; J$ G7 K<風薬/          > &#9418;
+ F7 _& o) Z6 N風薬/          風薬/          611F 5192 836F感冒葯
% w; Q. M( Z) c! F4 b$ w退烧药
1 u; B$ U- f( Z5 r2 u& u3 I<tuishaoyao> &#9418;
. h9 a( `6 L% u! c6 ?: c  O, Stuishaoyaotuishaoyao9000 70E7 836F退焼葯
& a# b# g, j3 `$ M" t镇痛药 ; S; u! X. u" L# T# X  `, T; U
< zhitongyao> &#9418;
: A; J, L: s% g2 d4 ^zhitongyao zhitongyao9547 75DB 836F鎮痛葯 &#7939;&#7938;
5 G# s& m0 q# d  [5 h&#9400; 良药 (liangyao) <良薬/         > [↑] 5 v+ a  F4 a  N; \
&#9418; 826F 836F (006C 0069 0061 006E 0067 0079 0061 006F ) 7 C+ A2 O" d* o! K6 P
&#9404; C1BC D2A9 (006C 0069 0061 006E 0067 0079 0061 006F )
( R! l+ F# t, b$ s; n: M+ O5 a&#9407; 良葯 (liangyao) 9 k2 M+ }$ c2 M$ I& w
&#7939;&#7938; # R! ?' @$ d) N6 Q& S) M
&#9400; 特效药(texiaoyao) <特効薬/         > [↑] ( {7 ^' ^( P. K' R$ Y6 v- n+ s
&#9418; 7279 6548 836F (0074 0065 0078 0069 0061 006F 0079 0061 006F ) # `9 z* v- n2 O, h- w. r) v
&#9404; CCD8 D0A7 D2A9 (0074 0065 0078 0069 0061 006F 0079 0061 006F ) " ?5 D8 X1 ~% o, B/ R8 J8 u
&#9407; 特效葯(texiaoyao)
5 |( T1 }) u% [% s* E7 C  d& q7 U0 `6 k
3. 在ebstudio中输入文件选刚才生成的dic.html,字符定义文件和复合检索定义文件分别选择c2epw02.exe文件夹下的gaiji.xml、gaijimap.xml、complex.xml。 1 Q2 U- h+ c' `/ T9 h: \
4. 选择输出路径,填好所需选项,执行。执行步骤记录可看log文件。 * ~' W+ ^3 v' t8 p4 N
5. 生成了词典文件。 9 w/ w. |; N9 R7 ^
6. 测试结果如下:
/ P; N+ E( r$ g7 u指定できる検索語:
* W+ N1 S1 e+ J3 w& i/ s' } ピンイン(声調有/無)、ユニコード(hex)、[互換]JIS漢字
- a3 {, H* k: A0 \0 ]1 k5 [
1 p6 U$ q5 U  s' y' \4 h8 J; F% ~$ J用拼音进行搜索,在end、cross、auto模式下可以检索到。
3 u, O1 B+ i# f& C# K
! i2 ?4 Z0 u3 v: e. p- A" y
  u% g# U$ t; A) a用中文检索,只能在互换汉字下检索到,例如中可以,中药就不行(互换汉字?)。
8 s9 K: r4 ^- J* v) O6 X8 v1 K4 m4 l" x: ~% r9 }5 ]$ t

, l  @- v$ b% b, f6 `日文检索,输入 “飲み薬”,可在front、auto、full等模式下检索到。 : |& L* N# ]& M/ [& D, S

% S, A8 f$ z/ q1 `. [- j& ~- n! M" V1 q) f
输入 薬 ,可在cross、auto等模式下搜索到。
" b: [0 O8 e8 P( z4 S) y6 Y. ]2 J7 [# p; i' N( T+ j; f
四. 小结: , i5 c% V7 a- F! f' @* V
综上所述,英日、日英epwing词典的制作,主要是准备text文本花时间,其他没有什么困难。
* B2 C1 I) J( G中日词典还是要拼音检索,否则输入替换汉字检索会损失大量信息。而要给大量词条注拼音更是繁琐,不过也许可以用word的注音功能实现,有机会再尝试吧。(选择中文词条粘贴至word内,注音后另存text,调整格式,粘贴与日文释义合并?)
3 G7 x. P$ I) c7 e7 [即使用拼音检索,也未实现在exact模式下检索,这对使用大量词典时是个问题。

该用户从未签到

发表于 2010-7-8 19:44:07 | 显示全部楼层
看来还是有些繁琐,学习中。。。

该用户从未签到

发表于 2010-11-26 20:27:49 | 显示全部楼层
这是好东西啊$ _( j' D1 m3 w+ f
谢谢楼主的分享8 `' h$ h2 e) G; j# H8 r" i0 x1 C
有机会一定要试试
  • TA的每日心情
    开心
    2021-2-5 15:40
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    发表于 2011-5-28 12:24:02 | 显示全部楼层
    感觉比制作MDICT词典复杂,特别是汉字的显示问题。下面的链接是介绍如何制作词典的介绍,英文的:
    " u2 k8 \, _4 g; ?! z( p) bhttp://www.japaneselanguagetools.com/docs/EBstudio.html

    该用户从未签到

    发表于 2011-6-23 13:06:41 | 显示全部楼层
    还是有些繁琐,学习中。。。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-27 18:20 , Processed in 0.053823 second(s), 13 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表