掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 892|回复: 11

[求助] 请教一个mdict制作上的问题

[复制链接]

该用户从未签到

发表于 2010-8-17 10:18:08 | 显示全部楼层 |阅读模式
手上有一个韩-韩的词典,想要转换成mdx,基本上已经完成了,还剩下一个小问题,不知道有没有人能给点建议。6 Z7 Z) Q/ h5 {0 }* r
7 p8 ?3 `/ Q& z, U
我现在已经把文本格式整理成:
( w0 ?* @- \; |( E3 U词条1 K0 M: o5 F& M9 W
释义
! L% |$ N( M( [' |9 a</>
, T5 W! ]$ k5 T! l- E- @  j. @的形式,但其中有少数词的格式是这样的:7 Y. L' D$ E/ z, W
词条
( ^4 Z7 v, W7 U' E; A: x& ]词条的另一种写法- ~9 U! N/ J$ V# O+ o
(词条的其他写法,如有)4 t% ^# |$ X/ l5 V
释义( ]& Z( r6 f* b$ S! u/ ^
</>' U* [. }. v0 s) \: e
直接转换是没有问题的,但这样一来“词条的另一种写法”就成了释义的一部分,有没有什么办法可以使之也可以直接用于检索呢?; n; f+ i* L4 h8 P( p) ?% R5 f

) }. Z5 g3 O% @2 K% L9 J* M按照https://pdawiki.com/forum/thread-4498-1-1.html这个贴子的方法尝试过将标题同义词之间的间隔符进行了定义,可惜在转换过程中有一小部分韩语中的unicode字符变成了乱码。
4 B; b8 k' i" }- g9 ]+ n0 {+ f& t; M! X6 V- x9 x$ a3 f. T
不知Mdxbuider能进行标题同义词的定义吗?还是说就没有别的办法了?请识者教我,多谢!

该用户从未签到

发表于 2010-8-18 15:32:04 | 显示全部楼层
同义词要利用Redirect的功能来实现。例如A和AA的含义都是B的话写成:) Y. B- J( H6 M
A
! ]$ V0 G1 M) ?" l# TB
; {  v: Z& u" ^+ s, g  ^</>. e6 n0 O" N" I/ q& T, d$ O  E; ]+ a2 j  b
AA
/ S) u. Z/ i0 Z4 }3 _@@@LINK=A( x5 l+ R3 G/ M, D9 U
</>
+ U( Z. _5 J3 c
: x. L) S8 l' t7 x这样在条目列表里就会出现A和AA, 点击这两个条目显示的内容都是一样的。

该用户从未签到

 楼主| 发表于 2010-8-18 16:53:03 | 显示全部楼层
谢谢Rayman亲自回答,不过这个词典收词27万,还有11000个同义词,手工处理恐怕是不行的了,昨天晚上用UWSC处理了一晚上,大约处理了1000多条,打算放弃了。如果mdxbuilder能对标题同义词之间的间隔符进行定义自动生成就好了。

该用户从未签到

发表于 2010-8-18 18:49:49 | 显示全部楼层
你可以用uedit32程式,就可以批量轉換了!不需要手工处理,如果你不懂程式的語法,你可以在論譠中找一找,或上傳文本,論譠中排版的高手多的是!

该用户从未签到

发表于 2010-8-18 20:41:04 | 显示全部楼层
如果你的词典原来就有固定格式,那应该可以借助正则表达式替换来实现批量修改的。

该用户从未签到

 楼主| 发表于 2010-8-19 09:21:57 | 显示全部楼层
论坛上传附件有512K限制,我这个文档有47兆,要压90个包,就不上传了,而且我还是希望能够得到“渔”而不仅仅是“鱼”,所以还是请高手指教下应该怎么做。我前期的处理都是在uedit下做的,现在得到的文本,下面是部分示例,每个词的释义由换行+tab开始,请注意第四个词,第二行没有tab开头,是同义词,第三行其实是将两种同义词的写法归纳一遍,也可以算作释义的一部分,删去也不影响。第四行才是真正的释义。正则表达式我是不太明白,给各位添麻烦了,多谢!
- h( n/ ~- m$ v, a+ E4 W7 F! c3 Z1 b9 `3 q5 X7 `; `, G
1 E4 y, W5 O, a3 @+ s. ~" `$ Z/ S& C
. p% d1 `  n$ l3 {. B) \, e- g" r7 Q
&#44264; &#45348;&#53944;
5 w$ G# p6 O& f; T6 _, ]' t        <p>&#44264; &#45348;&#53944;</p><p> [&#44264;:-] (&#50689;&#50612;goal net)</p><p>[&#47749;&#49324;]</p><p>《&#52404;&#50977;》 &#52629;&#44396;, &#54616;&#53412; &#46384;&#50948;&#51032; &#44221;&#44592;&#51109;&#51032; &#44264;&#45824; &#46244;&#50640; &#52828; &#44536;&#47932;. </p>  }' ?4 L1 x0 z
</>
" n$ J2 t, Z6 N. r' e) g/ z2 y) j&#44264; &#46972;&#51064;
# H4 R5 d9 z4 _+ t  g8 h$ T' p( F4 G        <p>&#44264; &#46972;&#51064;</p><p> [&#44264;:-] (&#50689;&#50612;goal lI ne)</p><p>[&#47749;&#49324;]</p><p>《&#52404;&#50977;》</p><p>1         = &#44208;&#49849;&#49440;(決勝線).</p><p>2         &#52629;&#44396;&#45208; &#54616;&#53412; &#46321;&#51032; &#44221;&#44592;&#51109;&#50640; &#44264;&#51032; &#46160; &#44592;&#46181;&#51012; &#51060;&#51008; &#49440;. </p>
4 y* ~$ a- e; Y8 m5 O* {/ \4 v</>
) q$ _9 z; Y7 Z) L9 C# b&#44264; &#53413;
+ b- ?" P- @# I. U        <p>&#44264; &#53413;</p><p> [&#44264;:-] (&#50689;&#50612;goal kI ck)</p><p>[&#47749;&#49324;]</p><p>《&#52404;&#50977;》</p><p>1         &#52629;&#44396;&#50640;&#49436;, &#49345;&#45824;&#48169;&#51060; &#44264; &#46972;&#51064; &#48150;&#51004;&#47196; &#52264;&#45240; &#44277;&#51012; &#51088;&#44592;&#54200; &#44264; &#50640;&#50612;&#47532;&#50612;&#50640; &#44032;&#51256;&#45796; &#45459;&#44256; &#52264;&#45716; &#51068;.</p><p>2         &#47085;&#48708;&#50640;&#49436;, &#53944;&#46972;&#51060;&#47484; &#54620; &#46244;&#45208; &#46608;&#45716; &#44264;&#45824;&#50752; &#44032;&#44620;&#50868; &#44275;&#44620;&#51648; &#44277;&#44201;&#54616;&#50688;&#51012; &#46412; &#46301;&#51216;&#54616;&#44592; &#50948;&#54644; &#52264;&#45716; &#51068;. </p>" s$ `, D- |6 b# H; b2 l& [
</>8 }1 S. a' w" G4 h, x- E$ {$ }
&#44264; &#51648;&#47476;&#45796;
9 @( \8 B/ X8 y* a4 I&#44264;&#51012; &#51648;&#47476;&#45796;
! s0 k  U0 w% f        <p>&#44264;(&#51012;) &#51648;&#47476;&#45796;
" i3 A. q0 C. J9 [0 U9 [        <p> &#48173;&#51012; &#49464; &#48264;&#51704; &#44040;&#45796;. </p>9 {7 D( J6 B4 ?" z9 c! e7 T
</>
1 U! b4 X. v% Q&#44264;&#44033;&#44592;
7 U: l  U3 O  F- {( E& p. L        <p>&#44264;&#44033;-&#44592;【骨角器】</p><p> [-&#45180;]</p><p>[&#47749;&#49324;]</p><p>《&#44256;&#44256;&#54617;》 &#49437;&#44592;&#49884;&#45824;&#50640; &#46041;&#47932;&#51032; &#48904;, &#49108;, &#51060;&#48744; &#44057;&#51008; &#44163;&#51004;&#47196; &#47564;&#46304; &#50672;&#51109;. &#46020;&#45180;, &#52285;, &#54876;&#44256;&#51088;, &#45210;&#49884;, &#48148;&#45720; &#46384;&#50948;&#44032; &#51080;&#45796;. [&#52280;&#44256;] &#44264;&#44592;. &#44033;&#44592;. </p>0 c" p: `" m6 H" r8 r
</>
' C7 i, h1 Q6 Z9 W$ C2 B&#44264;&#44036;
% s; Z" e: ?8 o5 y9 J; r( J        <p>&#44264;&#44036;【骨幹】</p><p>[&#47749;&#49324;]</p><p>1         = &#48904;&#45824;.</p><p>2         = &#44264;&#51088;(骨子). </p>! r2 n! Z& f" |  {/ _$ L5 V
</>: T9 [; X$ Y- Z* X7 g" w
&#44264;&#44048;1 x3 Q# I$ C: Z+ Q7 p
        <p>&#44264;-&#44048;</p><p> [&#44264;:-]</p><p>[&#47749;&#49324;]</p><p>《&#49885;&#47932;》 &#44867;&#51088;&#47532;&#50640;&#49436; &#44845;&#51648; &#51901;&#51004;&#47196; &#45348; &#44040;&#47000;&#51032; &#44264;&#51060; &#51256; &#51080;&#45716; &#44048;. </p>
# R5 h- j, \4 L- `) W' d' N</>

该用户从未签到

发表于 2010-8-19 09:41:02 | 显示全部楼层
我看过你的排版,但我不懂韩语,我想所有没有tab的韩语应该是第二个解释吧?如果是的话就容易决了,使用正则表达式就可以在没有tab的前端加一个@@@link=的符号!

该用户从未签到

 楼主| 发表于 2010-8-19 10:03:17 | 显示全部楼层
a
- o; u* g0 |- a( u: e* T: V@@@link=b$ T6 U" Y' a6 F# l) m8 q& j5 u
释义0 i8 i, q6 V) V0 B0 X7 E

' N) w$ ?1 W0 h. t! f这样也可以吗?如果是这样就方便了,谢谢!
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    发表于 2010-8-19 10:38:15 | 显示全部楼层
    editplus 正则表达式替换
    % W7 D) q9 Z: m* p" Y) l" u) Z查找 “<\/>\n([^<>]*)\n([^<>]*)\n ”
    3 I: ?* i' [9 d$ Y3 x; H; S( {替换为 “</>\2\n@@@link=\1\n</>\n\1\n ”( ?5 M5 b2 \( g! B
    即可
    * w& \" e, ^% v
    / N; r/ T9 L1 P) M, f' Rthread-4498-1-1.html mdict编辑器暂不支持unicode字符显示

    该用户从未签到

     楼主| 发表于 2010-8-19 11:49:11 | 显示全部楼层
    本帖最后由 wonthen 于 2010-8-19 13:07 编辑
    0 L8 U2 u' |' {( g, `, \3 L* O; Z4 t7 L: Y* N0 G) p( s
    感谢ldcau!试验了半天,还有三点小问题:
    / k9 @, H* z, _1.替换后生成的文本中第一个同义词直接连在前面的</>后面了,还好我自己能设法加一个换行上去。
    5 |( X/ I) H% y  P$ w2.替换的文本中@@@link=应该是@@@LINK=,我也自行修改了。
    ( H+ y) x9 [. v2 F8 I3.最要命的是,文本中还有以下这样的格式:
    + q6 D7 `( E, E
    - q' @) [& P: l3 NA
    + J2 Z2 s( W8 W8 A- @5 vB. i7 S, y$ @! D* [1 m. Q  N  l
    C# c: D; W7 Q' r8 a
    D& b5 k$ j! U# x3 F3 O
            E
    ; V  e; H0 W, p5 a6 a8 ?* B其中ABCD都是同义词(还有更多的同义词,最多的一处有8个),按照刚才的正则表达式替换,只有B被当作词头了,而C和D依然没有作为词头,这个问题我慢慢再想想能不能解决。总之非常感谢!

    该用户从未签到

     楼主| 发表于 2010-8-19 13:23:21 | 显示全部楼层
    本帖最后由 wonthen 于 2010-8-19 13:35 编辑 , ~9 B/ S8 k1 W- J2 A3 t! \( \4 x

    1 e/ {! P6 a& B<\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n
    6 B& v+ D, e; r7 Y' }4 X& _2 L$ d4 r/ n* E/ G/ b
    </>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n\5\n\6\n\7\n\8\n
    * q: q* ]7 a/ l* n2 Y
    $ q$ B, M  t9 b6 R) {0 [1 a4 |<\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n) U- h! z9 c0 N  x2 {/ _: I

    . T; n0 q5 m& m  I3 x</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n\5\n\6\n\7\n* L$ J% y, w0 S
    - w; ~, I; b% h  L3 g
    <\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n
    , A7 F" S# l7 u2 v% c+ l: l  e
    + T% D8 n; \/ ^1 g</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n\5\n\6\n
    9 ^7 z; J( O) K+ d: F5 f" C- q9 D6 f9 {
    <\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n
    ! ^' Z8 x! U( L9 @( t% O
    7 d$ L7 k- z) g. e  Y) {</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n\5\n
    ( X, d9 F9 d% U0 O5 |2 E2 W) L
    / h0 d" p% Q/ ~( ]/ L2 G) r- `<\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n
    ' U% g1 Q1 o  u+ P5 n/ F4 G; |: [; Q; j- q
    </>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n8 c- w& n4 m- a+ E! W, i0 Q
    # I5 q7 L. \4 w
    <\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n
    . y0 Z; z1 h/ g6 B; `$ {6 T6 Q+ }
    </>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n
    # W8 s9 p3 v4 f. }  s( ~4 H8 ^, n5 r& i, `
    <\/>\n([^<>]*)\n([^<>]*)\n5 b3 x1 n* F- B1 B0 U& n$ b
    ; W( r2 |  |0 d
    </>\n\2\n@@@LINK=\1\n</>\n\1\n
    ' R. c: f" h; C: c% a: o
    " L5 L* a( d0 {3 V' u" N这样好像可以,多谢各位帮助!

    该用户从未签到

    发表于 2010-9-1 08:08:46 | 显示全部楼层
    本帖最后由 莲花无语 于 2010-9-7 19:20 编辑 / C4 B" e  @9 d" p) h4 Y
    ; u( i( `6 L/ [7 B5 q) v
    看看这个也长见识,同义词,我一直用链接的方法,rayman给出的更简单,谢谢了,有空儿试试。
    9 q- {. r9 c! Z. e: B" p2010.9.7试验过了:失败
    . B1 k2 s7 g" \; d. P: v  DAA- u3 V+ }: U. M: ~
    @@@LINK=A
    ) i- Q+ T! z; M( j% {! f( y; G6 A</>' E$ I. D" z4 R* Q- n6 o
    没有成功,不知问题处在哪里;还是先用着链接的方法吧,这个好用:
    ! n3 G/ c# K/ {$ Z4 P+ @0 ~<a href="entry://被链接词条">显示文字</a>
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-18 22:56 , Processed in 0.082558 second(s), 13 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表