掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 893|回复: 11

[求助] 请教一个mdict制作上的问题

[复制链接]

该用户从未签到

发表于 2010-8-17 10:18:08 | 显示全部楼层 |阅读模式
手上有一个韩-韩的词典,想要转换成mdx,基本上已经完成了,还剩下一个小问题,不知道有没有人能给点建议。1 p9 C- w& t/ X& T5 {8 ?3 I
# l8 K' A' V9 \, M
我现在已经把文本格式整理成:
7 E) `0 n! j$ D% j* K$ K词条' y0 C5 q) s9 u2 D- B8 u
释义& n+ c) [1 K0 W/ I- F) j
</>
0 K/ ^8 B% G) m6 K; ]的形式,但其中有少数词的格式是这样的:! J9 J* f0 s+ }
词条  l7 W" d+ P0 Z. L7 v" _: Q& G! m- H
词条的另一种写法5 o8 Q5 F# |/ i+ O% @
(词条的其他写法,如有)$ P+ G0 L# _- N
释义
! W  o) V$ s- {" f0 G1 H: U" b</># k- c4 q% O# K3 ^: v
直接转换是没有问题的,但这样一来“词条的另一种写法”就成了释义的一部分,有没有什么办法可以使之也可以直接用于检索呢?0 l* _4 T7 T% ?! ]

$ e" Q2 O( C( M. [! P按照https://pdawiki.com/forum/thread-4498-1-1.html这个贴子的方法尝试过将标题同义词之间的间隔符进行了定义,可惜在转换过程中有一小部分韩语中的unicode字符变成了乱码。: G8 y2 m% o5 s. S
8 P/ z, P5 d! ?9 o
不知Mdxbuider能进行标题同义词的定义吗?还是说就没有别的办法了?请识者教我,多谢!

该用户从未签到

发表于 2010-8-18 15:32:04 | 显示全部楼层
同义词要利用Redirect的功能来实现。例如A和AA的含义都是B的话写成:! h5 m) F7 w2 F! K! z3 _
A. U# N) U4 h& J/ p* j& M
B
- ?8 b8 I! y/ t2 O9 B2 K" T</>
; }* r5 C4 p5 A- K  jAA
* x( B$ x. x0 v" Q6 E  k9 n& t2 Y@@@LINK=A9 V3 R6 l2 G6 C+ ^+ l
</>
# ]" b5 e; [% B2 C% E. [+ g
2 _& J+ ?: G# m' L这样在条目列表里就会出现A和AA, 点击这两个条目显示的内容都是一样的。

该用户从未签到

 楼主| 发表于 2010-8-18 16:53:03 | 显示全部楼层
谢谢Rayman亲自回答,不过这个词典收词27万,还有11000个同义词,手工处理恐怕是不行的了,昨天晚上用UWSC处理了一晚上,大约处理了1000多条,打算放弃了。如果mdxbuilder能对标题同义词之间的间隔符进行定义自动生成就好了。

该用户从未签到

发表于 2010-8-18 18:49:49 | 显示全部楼层
你可以用uedit32程式,就可以批量轉換了!不需要手工处理,如果你不懂程式的語法,你可以在論譠中找一找,或上傳文本,論譠中排版的高手多的是!

该用户从未签到

发表于 2010-8-18 20:41:04 | 显示全部楼层
如果你的词典原来就有固定格式,那应该可以借助正则表达式替换来实现批量修改的。

该用户从未签到

 楼主| 发表于 2010-8-19 09:21:57 | 显示全部楼层
论坛上传附件有512K限制,我这个文档有47兆,要压90个包,就不上传了,而且我还是希望能够得到“渔”而不仅仅是“鱼”,所以还是请高手指教下应该怎么做。我前期的处理都是在uedit下做的,现在得到的文本,下面是部分示例,每个词的释义由换行+tab开始,请注意第四个词,第二行没有tab开头,是同义词,第三行其实是将两种同义词的写法归纳一遍,也可以算作释义的一部分,删去也不影响。第四行才是真正的释义。正则表达式我是不太明白,给各位添麻烦了,多谢!
5 Z0 v1 ^8 ^6 e- P  E
& X& q; ~- h$ \$ o! c9 v. j3 H% W" U+ f9 p/ l

, J, y9 B' S* O4 U&#44264; &#45348;&#53944;
; u1 l0 d. u' Y        <p>&#44264; &#45348;&#53944;</p><p> [&#44264;:-] (&#50689;&#50612;goal net)</p><p>[&#47749;&#49324;]</p><p>《&#52404;&#50977;》 &#52629;&#44396;, &#54616;&#53412; &#46384;&#50948;&#51032; &#44221;&#44592;&#51109;&#51032; &#44264;&#45824; &#46244;&#50640; &#52828; &#44536;&#47932;. </p>8 [/ E* C& q: a6 R7 Q8 d4 A
</>0 k+ `5 p) z& Z1 B1 h
&#44264; &#46972;&#51064;
4 A3 i3 Y/ J7 v$ w        <p>&#44264; &#46972;&#51064;</p><p> [&#44264;:-] (&#50689;&#50612;goal lI ne)</p><p>[&#47749;&#49324;]</p><p>《&#52404;&#50977;》</p><p>1         = &#44208;&#49849;&#49440;(決勝線).</p><p>2         &#52629;&#44396;&#45208; &#54616;&#53412; &#46321;&#51032; &#44221;&#44592;&#51109;&#50640; &#44264;&#51032; &#46160; &#44592;&#46181;&#51012; &#51060;&#51008; &#49440;. </p>2 V" h8 U& z( X3 `0 i8 [7 \  u
</>( V! V7 T; }6 T4 d  ~- Y1 ]
&#44264; &#53413;2 X2 ~7 W- l1 }
        <p>&#44264; &#53413;</p><p> [&#44264;:-] (&#50689;&#50612;goal kI ck)</p><p>[&#47749;&#49324;]</p><p>《&#52404;&#50977;》</p><p>1         &#52629;&#44396;&#50640;&#49436;, &#49345;&#45824;&#48169;&#51060; &#44264; &#46972;&#51064; &#48150;&#51004;&#47196; &#52264;&#45240; &#44277;&#51012; &#51088;&#44592;&#54200; &#44264; &#50640;&#50612;&#47532;&#50612;&#50640; &#44032;&#51256;&#45796; &#45459;&#44256; &#52264;&#45716; &#51068;.</p><p>2         &#47085;&#48708;&#50640;&#49436;, &#53944;&#46972;&#51060;&#47484; &#54620; &#46244;&#45208; &#46608;&#45716; &#44264;&#45824;&#50752; &#44032;&#44620;&#50868; &#44275;&#44620;&#51648; &#44277;&#44201;&#54616;&#50688;&#51012; &#46412; &#46301;&#51216;&#54616;&#44592; &#50948;&#54644; &#52264;&#45716; &#51068;. </p>4 z% @# X* v# O5 J4 K8 W2 j7 r7 b0 X
</>
: [( h/ E. ^4 Y) [" n&#44264; &#51648;&#47476;&#45796;
0 |8 P" s  E& o. n7 `- n&#44264;&#51012; &#51648;&#47476;&#45796;
- W4 y: s2 U+ Z! H7 U2 o        <p>&#44264;(&#51012;) &#51648;&#47476;&#45796;
5 \7 V3 K9 K( G; O  w6 i$ L        <p> &#48173;&#51012; &#49464; &#48264;&#51704; &#44040;&#45796;. </p># n3 u- ^" \9 d. _7 A" A
</>) r4 U6 I: L% m8 ]0 L
&#44264;&#44033;&#44592;
( q2 T# h& D0 y% l& x: @8 L5 t8 r        <p>&#44264;&#44033;-&#44592;【骨角器】</p><p> [-&#45180;]</p><p>[&#47749;&#49324;]</p><p>《&#44256;&#44256;&#54617;》 &#49437;&#44592;&#49884;&#45824;&#50640; &#46041;&#47932;&#51032; &#48904;, &#49108;, &#51060;&#48744; &#44057;&#51008; &#44163;&#51004;&#47196; &#47564;&#46304; &#50672;&#51109;. &#46020;&#45180;, &#52285;, &#54876;&#44256;&#51088;, &#45210;&#49884;, &#48148;&#45720; &#46384;&#50948;&#44032; &#51080;&#45796;. [&#52280;&#44256;] &#44264;&#44592;. &#44033;&#44592;. </p>
/ o3 n: p* G/ \5 c3 E( p2 U</>, h7 `$ F4 p: l/ k, x
&#44264;&#44036;1 y- D7 _9 k7 Y1 j- b" i: K4 y
        <p>&#44264;&#44036;【骨幹】</p><p>[&#47749;&#49324;]</p><p>1         = &#48904;&#45824;.</p><p>2         = &#44264;&#51088;(骨子). </p>% {% |( M0 g5 S  w1 P
</>1 \- ^! p5 c' ~  Z0 C
&#44264;&#44048;4 p9 z/ V2 z: i9 l
        <p>&#44264;-&#44048;</p><p> [&#44264;:-]</p><p>[&#47749;&#49324;]</p><p>《&#49885;&#47932;》 &#44867;&#51088;&#47532;&#50640;&#49436; &#44845;&#51648; &#51901;&#51004;&#47196; &#45348; &#44040;&#47000;&#51032; &#44264;&#51060; &#51256; &#51080;&#45716; &#44048;. </p>
0 W6 c  L, K: Z- W; h" Z1 U</>

该用户从未签到

发表于 2010-8-19 09:41:02 | 显示全部楼层
我看过你的排版,但我不懂韩语,我想所有没有tab的韩语应该是第二个解释吧?如果是的话就容易决了,使用正则表达式就可以在没有tab的前端加一个@@@link=的符号!

该用户从未签到

 楼主| 发表于 2010-8-19 10:03:17 | 显示全部楼层
a
; A+ Q; i4 C6 d4 \@@@link=b
" c, J% l& ~; W' ^1 I释义
' V' J+ g4 o0 G4 m0 @* F: L
4 D+ w6 n6 s' x; \- F& v- T  n这样也可以吗?如果是这样就方便了,谢谢!
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    发表于 2010-8-19 10:38:15 | 显示全部楼层
    editplus 正则表达式替换
    2 S" N% K8 U- w& O查找 “<\/>\n([^<>]*)\n([^<>]*)\n ”
    , _' L3 c' x# d+ t" J替换为 “</>\2\n@@@link=\1\n</>\n\1\n ”; c. {& I  x3 L+ n
    即可. n5 {4 o  U9 W+ o* K
    3 k7 }/ y. k7 D5 s# y+ ~
    thread-4498-1-1.html mdict编辑器暂不支持unicode字符显示

    该用户从未签到

     楼主| 发表于 2010-8-19 11:49:11 | 显示全部楼层
    本帖最后由 wonthen 于 2010-8-19 13:07 编辑 3 T5 Z6 e; F  z
    ; o- [9 A, A9 ?
    感谢ldcau!试验了半天,还有三点小问题:7 X% X6 Q- O3 }# Y6 M, \7 G
    1.替换后生成的文本中第一个同义词直接连在前面的</>后面了,还好我自己能设法加一个换行上去。
    ( @* |6 K, P0 t, I9 `2.替换的文本中@@@link=应该是@@@LINK=,我也自行修改了。! V4 Y7 z  j8 M, W
    3.最要命的是,文本中还有以下这样的格式:! f0 b7 [% R3 P" t- ?1 I
    , R9 H7 s6 p  O+ S8 m! d1 X
    A. M' F9 }  w2 X
    B
    ( j; u* @7 q& B5 DC2 {  a3 Y. F0 ~1 `7 |  i% U& q
    D' ^4 n5 w+ L3 I" p7 x; X+ p- A5 t
            E9 ]/ Z/ a) l2 k! h2 P
    其中ABCD都是同义词(还有更多的同义词,最多的一处有8个),按照刚才的正则表达式替换,只有B被当作词头了,而C和D依然没有作为词头,这个问题我慢慢再想想能不能解决。总之非常感谢!

    该用户从未签到

     楼主| 发表于 2010-8-19 13:23:21 | 显示全部楼层
    本帖最后由 wonthen 于 2010-8-19 13:35 编辑 9 r6 f$ z2 P# ^, p
    : v: w5 p& W9 ~, @5 u6 W% H9 a8 d
    <\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n  T' R6 n$ _3 T3 o& [) ~

    ) {# T6 a% t$ Z- N5 n</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n\5\n\6\n\7\n\8\n
    ! t2 p# v: N& Q7 }2 `! Q  k% S! P! ?; w
    <\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n5 g$ ?* Q# G6 P2 a- B7 j! l- N6 O

    . c! _# H, d$ Y: m! v</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n\5\n\6\n\7\n
    ' {8 O2 d, G( |4 I0 v3 s& r5 C! Q' h' Y& G5 A+ C1 f
    <\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n
    1 |) J1 Y$ V. C/ n5 A
    ( |* z5 [+ O! I. B  m$ [$ }</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n\5\n\6\n1 |. N4 g2 n, |  r! ?) [5 a& I

    & g2 a2 i9 p7 `: G" ^<\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n
    5 s) U5 e4 k' b' H( {$ w/ |2 e6 n4 x+ H/ Q1 r, w
    </>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n\5\n3 k! _# y4 P$ `8 L/ \- A
    0 W: C! n; Y: U5 m$ l
    <\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n! B, q" Q9 H" P

    ! r- j/ i# t/ I</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n+ [% z5 e# W1 C, ^+ h& `  T

    7 K0 ]9 h+ u" S<\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n( {8 B8 g9 |7 n. Q

    1 S% T4 N4 }" a( G( j2 q</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n& D. {9 n, Q: _9 u3 ~! Y

    4 b1 G' o. U! ~& b4 K# W<\/>\n([^<>]*)\n([^<>]*)\n
    6 `4 z6 K" \. P/ E4 F: A. A
    ' F0 ]+ G3 M$ f  U</>\n\2\n@@@LINK=\1\n</>\n\1\n
    9 J2 w0 P- M: W- b' x/ X1 A8 a5 c1 r
    这样好像可以,多谢各位帮助!

    该用户从未签到

    发表于 2010-9-1 08:08:46 | 显示全部楼层
    本帖最后由 莲花无语 于 2010-9-7 19:20 编辑 5 t% L, m3 ^2 r7 c, }. A

    % E" W3 Z3 e/ E3 \看看这个也长见识,同义词,我一直用链接的方法,rayman给出的更简单,谢谢了,有空儿试试。6 `$ }/ F2 |3 i
    2010.9.7试验过了:失败! A6 x5 q: i- l* }, p- q
    AA
    - N! T) c( E4 u/ R@@@LINK=A
    ! ~% ?- O) F( V: b5 I+ v! j8 }</>* U. o  i  I, U4 G9 a- u3 z' Y
    没有成功,不知问题处在哪里;还是先用着链接的方法吧,这个好用:7 p2 n# G8 [6 F% j
    <a href="entry://被链接词条">显示文字</a>
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-28 09:17 , Processed in 0.106894 second(s), 13 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表