掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 2839|回复: 13

[求助] 請教mdict字典如何轉制成babylon格式

[复制链接]
  • TA的每日心情
    难过
    2020-2-18 14:09
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2013-1-8 05:11:30 | 显示全部楼层 |阅读模式
    hi大家好。3 E2 l& M/ @, w& c9 L6 W0 i3 F

    * V) F$ }2 E( }) y( {- G$ c* X# h0 }在論壇上找到一個“牛津高阶学习词典英汉双解第7版【OALD 8风格重新排版】”很棒。以前我所能找到的Babylon版的“牛津高阶双解第7版”都是一大堆字都就一、兩种顔色,看得眼花繚亂。
    , y. j1 p- V- g8 i3 i+ r
    $ ^2 S; M5 X' ~2 ^可是我平時又用Babylon比較多,所以現在想求教大家mdict字典如何轉制成Babylon版的?
    ! H  ?# v# B/ `* R( B8 p0 g# i3 o1 m. w4 d: P3 W" i: r8 `: X
    我試過用GetDict把.mdx文件導出為.txt文件,再導入到Excel文件(因爲Babylon Glossary Builder認可)。可現在的問題是GetDict導出為.txt文件中,内容與格式都是融合在一起的;而Babylon Glossary Builder卻要求内容、格式分別導入或者分別定義,否則它就拒絕製作。。。。。
    5 L4 N: Y9 G" S- v% y8 W7 A+ T. n- o- A  [5 j8 ^
    大家有何高招或者clues?
    9 X) a% `4 q! j  j9 n2 Z7 v謝謝

    本帖被以下淘专辑推荐:

    该用户从未签到

    发表于 2013-1-8 08:39:24 | 显示全部楼层
    应该可以用正则表达式,我没试过,纯属建议

    该用户从未签到

    发表于 2013-1-8 10:02:25 | 显示全部楼层
  • TA的每日心情
    难过
    2020-2-18 14:09
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2013-1-8 21:07:05 | 显示全部楼层
    3# heshunyihugh
    ) x# N/ B- \, }+ R, B) \) ^! h8 ~; T* H4 n' B* w; L3 M

    1 j! W1 u7 r3 a" q$ q對的。.MDX to .TXT這一步,我用的就是這個鏈接上推薦的GetDict.exe& F: S" O1 P5 W1 L" K
      T0 X$ y4 \  V3 J' f( H
    現在的問題卻是在.txt(.xls) to .bgl這一步,這一步有軟件了(Babylon Glossary Builder),但是卻又把融合在一起的内容分離開的問題

    该用户从未签到

    发表于 2013-1-8 21:45:07 | 显示全部楼层
    4# supernj " W& f8 j4 g  j* I2 A' S1 ^; I0 s
    呵呵,你先讲讲哪里导入格式,哪里导入内容,以及格式的格式,我告诉你如何分离。
  • TA的每日心情
    难过
    2020-2-18 14:09
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2013-1-9 02:57:19 | 显示全部楼层
    4# supernj ; B; m$ C( v$ y0 {9 Y* ?3 G' v& d
    呵呵,你先讲讲哪里导入格式,哪里导入内容,以及格式的格式,我告诉你如何分离。4 Q, g! O. [4 d1 K
    sxingbai 发表于 2013-1-8 21:45

    4 d# Q/ @" N) A8 y; M+ V& c/ Z2 D+ r
    . p/ d8 D4 ~( c! g可以先從此處(http://www.babylon.com/products/glossary-builder.html)下載安裝Babylon Glossary Builder。
    . [9 C, j( @4 W8 {) ]" v) i6 x" H4 B9 K6 o  c# C) m% p% \/ ~
    然後,你可以很方便的自建一個Excel文檔(比如sample.xlsx)。第一列錄入若干关键字,第二列是正文1(比如音標或詞性),第三列是正文2(比如解釋),第四列是正文3(比如例句)........在這個excel文檔中你所錄入的都是“内容”也就是將來會在babylon所能看到的東西。這些東西中你不可以包含html語句,比如<font size=5>whole</font>、<font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>等等,只能是“内容”,否則babylon會將這些html語句也當作“内容”原封不動的顯示出來,而不會做加粗、字號、斜体等動作。
    + t, y" Q( ~( [; H% ^) H% d2 l1 V* U' |1 l2 C7 X* a
    接下來你就可以運行Babylon Glossary Builder了。它是向導式的,前幾步很常規了,bu lah....bu lah....; A0 m1 e5 S; n9 s4 p# d* D  V: p( E4 n

    1 N6 E, x9 y* M) E% c到了第三步(the title is Data Source)導入剛才的那個sample.xlsx,也就是所謂的“内容”。(到這一步回答了“哪里导入内容”這個問題)
    6 u" N# t7 @1 s
      I, d' d6 G& |+ C第4步(the title is Data Table),確定哪一列是關鍵字列,確認正文1、正文2、正文3順序。。。。
    ) |& q3 j+ H% O6 O* j" O0 K
    5 ^& G  r) c+ y1 C' A$ `下面將要回答“哪里导入格式”這個問題:就在這個頁面,右下角有一個“Advnced styling...”的按鈕,點擊。ok你可以用html語句定義格式了,excel的第一列什麽格式、第二列什麽字體、第三列是否加粗,第四列什麽顔色。。。。everything, you name it.
    , Q; w! D5 ^) O+ e2 `7 ]) {* N
    1 L, E0 L9 X; t+ n& o: L+ Q然後,bu lah....bu lah....一個.bgl就生成了,就可以用babylon查詢單詞了。- U% h, E) R4 D- i2 c1 N# P

    ' G$ u  Y" {5 ]7 `' w9 M過程很簡單吧,但是現在我就卡在“得到excel文檔”這一步。因爲用GetDict把.mdx文件導出為.txt文件以後,“内容”與“格式”(也就是html語句)是融合在一起的。而從以上我所敍述的babylon字典的製作過程中卻可以看出Babylon Glossary Builder要求這兩者是分開的。而且在“内容”excel中,第一列如果關鍵詞,所有行都必須是關鍵詞(這個沒問題,excel很容易從.txt文件中把這一列切割出來);第二列如果是音標,如前所述,所有行都必須是音標(這也容易切出)。" _/ K+ h) A' \  {0 W

    ( E; N. V( |) W: Z! I+ v4 O5 S$ G/ g但是如果遇到詞性、解釋、例句。。。等等,這些就不是這麽簡單了。因爲一個單詞也許可以就一種拼寫,但是詞性可以有n個、解釋n+n個、例句n*n個。這麽多項目必須每類一列(也就是詞性1獨佔一列,詞性2獨佔一列。。。。。例句1獨佔一列,例句2獨佔一列。。。例句n獨佔一列,例句n+1獨佔一列),而且行與行之間,共同的列還必須對齊(因爲只有這樣後面你才可以對這一列定義html格式)。如果只有十幾個單詞,你可以人工做分列、對齊這些工作,但是一部字典幾萬個單詞,顯然人工來做就不現實。
    4 }; y$ w( m+ F1 g# A$ S8 O/ k5 V: }' e
    所以對於如何分离,想聼聼你的高見。
      X/ ?$ Q/ u( E: z4 [2 v
    3 L2 d9 e7 q# ~' J/ d" d3 ]也許換個思路,也有別的方法做出一部babylon字典,想聼聼大家的指點,謝謝!

    该用户从未签到

    发表于 2013-1-9 21:38:35 | 显示全部楼层
    6# supernj
    * H: Q7 k& y8 M
    $ X6 N& R$ z' f# C明白你的问题了,不知道你用的是不是旧版,表述时与我下载的似乎有些出入,不过关系不大。
    ' l7 B/ k2 ]- w( {; ~1.它不是只能导入excel,也能导入txt。直接选gls文件就行了,这个当然可以带格式;3 c6 e3 e, b. r* H
    2.如果想用excel,它需要的只是一个模板,也就是每一列的格式描述。格式描述简单,你现在感觉困难大概是不同格式的内容如何分列。大概可以这样,先把格式描述保存下来,然后不同的格式起止处加上特殊符号,然后把格式内容一一替换为空。+ E6 R: X4 E/ b, T1 \$ o8 j
    当然第一种方法应该已经可以解决问题。
  • TA的每日心情
    难过
    2020-2-18 14:09
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2013-1-9 23:17:13 | 显示全部楼层
    7# sxingbai ' c. c8 O& H$ h7 B& Z& j

    . V4 ~9 P* O0 k7 p: c' T
      o4 b* h8 V1 Z: [, i, `) R謝謝您的指點。
    " T  S4 t8 e6 @+ @: y- T2 C. C0 f$ ~7 Z0 d9 T- X' i4 y  A3 m
    我用的Babylon Glossary Builder版本號是3.1.0(r10).; n8 q; v* M+ Q# i3 X" M5 Y' i
    . ^: M' M  a1 Y) f
    關於你說的第一種方法。先前我也試過但好像不行。剛才又試了一遍,如果我preview效果,就會得到如下報錯信息:“External component has thrown an exception”
    5 ~# D  d6 G" p) o" U% T/ F( y0 t8 o- N* u0 S# Y6 ]

    6 y* U1 T$ b7 t/ J如果忽略報錯,強行build,得到如下結果:
    : w: Y$ `: Q" F: t! H# o* N
    ! y0 n& d* `6 Y  Y  @6 L$ u. W. Z: U
    - |9 F- I. e, x1 t2 Z. S1 a最終是:
    : ]% m+ z; U; L* _3 p) [& b' u! u
    7 r; ^" d* Y8 v) ?$ U8 m
    8 J. d4 Z# q( B2 U- |; _) L; O  O會不會是我的.txt文檔有問題呀?但我是用GetDict直接轉換出來的呀,用UltraEdit查看也無問題。源.mdx文檔來自heshunyihugh的牛津高阶学习词典英汉双解第7版【OALD 8风格重新排版】(https://pdawiki.com/forum/thread-9400-1-2.html),樓上的兄弟您確信可行嗎?如果可行請相告,謝謝!

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2013-1-10 17:23:08 | 显示全部楼层
    8# supernj 2 R+ q7 V: Q5 Z5 Z4 r. B
    你把转换后的文本修改成bb支持的格式了吗?
  • TA的每日心情

    2023-8-3 00:11
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2013-1-11 01:39:28 | 显示全部楼层
    我有一本德汉机电工程词典,先前是pdf,然后用电脑进行文字识别,效果很好,谁可以将它做成babylon文件呢?
  • TA的每日心情
    难过
    2020-2-18 14:09
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2013-1-11 09:43:14 | 显示全部楼层
    8# supernj
    + H  o  B1 E* W- }# W+ k- M. Z' L1 L你把转换后的文本修改成bb支持的格式了吗?  l" {' T3 M0 a+ H, u# }1 ^+ _
    sxingbai 发表于 2013-1-10 17:23
    6 r8 G/ G2 c) o8 ?& b
    4 j8 t/ n& l- F/ b( e6 L' `
    你的意思是修改那個.txt文檔?怎麽修改?願聞其詳

    该用户从未签到

    发表于 2013-1-11 13:30:52 | 显示全部楼层
    11# supernj 0 g0 z) y9 x* T( R5 _& Q% ~
    当然要修改。bb支持的格式应该是:条目,然后回车,解释,然后再回车。再回车一个空行。
  • TA的每日心情
    难过
    2020-2-18 14:09
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2013-1-14 04:06:10 | 显示全部楼层
    12# sxingbai ! M. s6 g1 D" e& K8 V

    2 {, C3 x5 M% O3 U" d2 g
    : h; q- X! S" ^+ Wok. gotcha, thx
  • TA的每日心情

    2023-8-3 00:11
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2013-1-21 18:52:17 | 显示全部楼层
    那mdd文件里面的图片怎么办呢?
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-2 10:58 , Processed in 0.025128 second(s), 28 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表