掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

12
返回列表 发新帖
楼主: bnuliujitao

[教程] 两步将mdx转为goldendict可用格式

[复制链接]

该用户从未签到

发表于 2012-2-15 22:36:56 | 显示全部楼层
liuyunrushui {:soso_e100:}
8 A: \: D6 C8 w4 Z% v不客气.
2 l1 z5 I! e2 W+ z; H' eLingvo DSL格式简单, Tag不多, 看看帮助文件, 再找些别人做好的你认为排版比较好的字典观摩一下. 基本也就可以上手了.
& X+ `, w6 M; F1 ~, h/ f% B: q; |网上有文章谈到, 如何制作DSL.
+ }7 w# X0 S, W  S) TDSL不难, GoldenDict对DSL支持很好[目前还不支持全文检索], 且容错.2 X% c) q: E/ x( y+ `5 e9 w
DSL转Lingvo用的LSD一般而言麻烦些. 这主要是因为出于某些特殊原因的考虑, Lingvo不容错DSL. 主要下面个问题:8 e$ _1 Q0 Y5 q+ f1 ], |
-重复词条. 1 U  E8 V5 a; E9 {- q$ X4 n
-嵌套标签[包含链接指向错误].
; K) j2 x0 P: x- l, w0 ~) k-由于源文件本身错误引发的问题; [一般BGL/MDX都会有错误]& n- p8 ~' g0 I+ z
在BGL/MDX等支持重复词条的字典转LSD的时候. 上面的三个问题还是比较突出的. 这三个问题可能会形成嵌套, 需要理清头绪, 方能庖丁解牛.
9 c. V' [5 t) f% `* ]. B2 b! K这3个问题具体的解决办法是八仙过海. 有阳春白雪的, 也有下三滥的. 能解决问题适合自己使用就行. 基本的方法是批量替换和个别修订, 个别修补基本上只能考虑个位数的数量, 否则太容易陷入被动, 尤其是大字典, 会累死而且字典还不见得做得好.
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2012-2-16 12:28:50 | 显示全部楼层
    谢谢大大的释疑!2 Y' G9 z- I! w, y$ F& [8 @, J
    " I. ^1 z. s# U1 r
    小弟是纯小白,还是不尝试制作啦!用各位大大的就足够了!再次表示感谢!/ A$ q; P  ?( E2 m! l
    2 u1 v1 L8 T  W# V# j  j  X7 J
    对啦,不知道大大对本论坛中的mdx转stardict的程序是否熟悉呢?小弟最近在尝试制作日语维基百科mdx版,然后尝试转换为stardict格式,以便在color和goldendict上使用。出现了一下问题,久思不得其解,不知道大大有没有思路哈。制作步骤及问题如下:3 k6 s+ ~) }: t
    . m( S2 X- j) r4 h4 }- s
    近日尝试转换日语版维基百科,因为块头比较大,转换的时候我就把xml分为了12个部分,分别转成txt,然后三个一组转换成mdx,经过试验在MDict上都可以读取,正常检索。但是在转换成stardict的时候出现了问题,第一个mdx(原始txt0-2合并后转成的mdx)可以转换成stardict,并且可以用stardict,colordict,goldendict读取,检索。可是第二个mdx(原始txt3-5合并后转成的mdx)能够转换成stardict,但是拷贝到词典文件夹目录后,提示建立索引,对话框结束后去词典选项查看,并没有第二个部分的数据,然后尝试检索后发现在mdict上可以检索到的第二部分的词条在stardict词库中检索不到!不知何故!

    该用户从未签到

    发表于 2012-2-16 14:05:02 | 显示全部楼层
    那个程序, 我也有用. 但我不从MDX->StartDict, 而是直接转成MDX源文件.  先仔细研究此MDX源文件, 然后再决定是否从此MDX源文件开始向其他字典转.
    5 d  ?( D* g5 v0 o: f) B
    4 d: n" O4 k. S. c3 F: m疑似该程序直接转StartDict的时候, 由于源文件的原因抑或是程序本身原因, 有的内容是不对的.* |% a4 E4 ?# Y
    另外: 你有TXT原文, 为何不直接按格式转StartDict或其他格式? 绕一圈回来的过程中, 中间环节出问题自然是可能的, 而且难以定位, 可能性太多了.
    : {9 `/ M: F; T- M- y( w3 u/ t8 N! m. R
    但是在转换成stardict的时候出现了问题,第一个mdx(原始txt0-2合并后转成的mdx)可以转换成stardict,并且可以用 stardict,colordict,goldendict读取,检索。可是第二个mdx(原始txt3-5合并后转成的mdx)能够转换成 stardict,但是拷贝到词典文件夹目录后,提示建立索引,对话框结束后去词典选项查看,并没有第二个部分的数据,然后尝试检索后发现在mdict上可以检索到的第二部分的词条在stardict词库中检索不到!不知何故!

    $ @* T7 L) e4 Z7 L7 l这个问题我亦不知, 抱歉. {:soso_e110:}
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2012-2-16 15:05:34 | 显示全部楼层
    多谢大大及时的指点!- f6 R- Q* n* }& U" W
    % x9 v0 w/ D/ _8 f/ k$ G5 `
    小弟用的是minirain大大的v2.1转的txt,可以直接转成stardict吗?
    " S+ [3 P8 |9 T; I5 R5 b0 g% z( l" Q
    ) S5 N) A; C/ V5 X可以的话具体该如何操作呢?烦请大大继续给予指导哦!多谢多谢!
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2012-2-16 20:53:51 | 显示全部楼层
    小弟也用UE打开了每个合成后的txt,发现格式啥的都一样呀,第一个词条最后一个词条格式都一样,不知道为何其他部分都不能检索呢!甚是怪异呀!
    - M/ B0 t# p5 e' f& W5 F
    3 A! G5 ^% N- D6 z6 w2 U小弟主要想使用goldendict的词典内部即点即译的功能,这样平时看日文维基就不用来回输入查找词条啦!' a4 g* \. [0 w2 s1 R! Z; g
    可是mdx转stardict让我吃尽了苦头!尝试了很多网上的方法也不行呢!
    4 r. @1 u8 W) Q. P( A
    7 H8 C# W8 {9 B& Z# |, S不知道是否还有其他途径转换维基为stardict呢?

    该用户从未签到

    发表于 2012-2-17 03:06:13 | 显示全部楼层
    本帖最后由 viarm 于 2012-2-17 03:12 编辑 * ~6 m# z* @( g- T; b( p: W) U

    ! q' D2 D* {0 q! Z* Hliuyunrushui
    & O7 t8 f' Z/ N' {不必客气. .( |& K% t1 m- Z/ I  B3 i' ^# u# J
    成品字典之间转换出现这样或那样的问题, 太容易理解了, 有N种原因可以导致此结果. 从原始文本按该字典本身规范一步步递解,  这样做的好处之一是确定问题相对单纯.
    * {8 a7 u& z3 w7 l2 j" W& W
    $ T: k2 \1 V1 |( p, i  s: T3 |! A3 i-http://www.360doc.com/content/11/1207/20/426561_170475462.shtml+ `  n" v3 r" a0 f1 K5 _1 I
    -http://article.yeeyan.org/view/33784/13965 . 这2个你可以看看.  
    % Q3 ]! c+ J! F-你如果非得从MDX->StartDict, 你可以试验一下MDX->MDX源文件->不用工具, 根据StartDict格式硬转.
    5 s. D# _& _, k/ m+ s  l& w$ { + R& G* e0 a% q! ?6 X0 [: \+ H
    小弟也用UE打开了每个合成后的txt,发现格式啥的都一样呀,第一个词条最后一个词条格式都一样,不知道为何其他部分都不能检索呢!甚是怪异呀!
    $ P, X1 v, l. o: P
    -看是有可能误差的. 看也不足以证明TXT没有问题. 一般而论, 有问题是绝对的. 只是看是什么问题, 影响到什么地步.
    / Z* |: I4 n, c2 }$ x8 }. }-TXT即使没有问题, MDX也可能存在问题, MDX->STARDICT就更有可能有问题. 当然, 即使字典真的没有问题, 那么字典显示也可能存在问题.
    0 n7 @0 a4 f* p0 R% a5 c# d( {-没必要把自己的希望建立在不清不楚的转换程序上, 自己动手吧. 你可按STARTDICT官方的方法先试验一二.
    - ^% A, E/ P( l7 P. ^6 [. g% P; B* g: g% @5 Y. Z5 o
    祝顺利.
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2012-2-18 12:06:53 | 显示全部楼层
    多谢大大!
    - o9 z6 _0 Z3 f$ T& i1 \小弟去试试!
    8 Q" E; N  Q  U2 |不过好大的txt文件呀!小弟的机器配置!!!
    7 j( J1 n# ~2 t/ y: j. [1 O3 E* `! b$ l4 N+ `
    实在不行就放弃啦!用mdict也非常非常不错!

    该用户从未签到

    发表于 2012-2-19 10:37:46 | 显示全部楼层
    华而不实的

    该用户从未签到

    发表于 2012-3-26 10:35:48 | 显示全部楼层
    11# zhu1234 0 {  T2 D8 p9 v% C
    附件7和8有问题,不能解压

    该用户从未签到

    发表于 2012-3-26 10:36:09 | 显示全部楼层
    !   C:\Documents and Settings\Administrator\桌面\ss.part07.rar: 压缩包数据中的 ss\ss.dict.dz CRC 失败。压缩卷被破坏
    5 l3 V4 L3 _) E- ?- j# b!   C:\Documents and Settings\Administrator\桌面\ss.part08.rar: ss\ss.dict.dz CRC 失败。文件被破坏
    * E3 r$ K2 p6 T, f! n!   C:\Documents and Settings\Administrator\桌面\ss.part08.rar: 压缩包数据中的 ss\ss.idx CRC 失败。压缩卷被破坏5 I! R3 Q: I( L* o1 x5 K$ s
    !   C:\Documents and Settings\Administrator\桌面\ss.part09.rar: ss\ss.idx CRC 失败。文件被破坏

    该用户从未签到

    发表于 2012-4-28 15:40:35 | 显示全部楼层
    希望有高手将百度百科转一下,自己试了很多次都不成功。

    该用户从未签到

    发表于 2012-4-30 03:39:28 | 显示全部楼层
    36# wdsggg
    4 s1 V) U2 x, Y* }+ c-Lingvo 不同版本对汉语的支持有些差别. & I  V, t4 u( H% D/ T: N
    -百度百科这种大东西, 转起来, 确实麻烦.

    该用户从未签到

    发表于 2012-7-3 13:17:14 | 显示全部楼层
    谢谢分享

    该用户从未签到

    发表于 2012-9-7 22:23:00 | 显示全部楼层
    2款转换软件已试用过,很好用, 谢谢楼主!!

    该用户从未签到

    发表于 2012-10-8 14:37:33 | 显示全部楼层
    百度百科我也试了,但是不成功。4 `7 f9 V. ~* d4 _2 A1 f; H9 j8 e
    有没有高手能转一下啊/

    该用户从未签到

    发表于 2012-10-8 14:40:02 | 显示全部楼层
    有没有方法把其它格式的词典转换成lingoes格式?

    该用户从未签到

    发表于 2013-1-14 19:58:00 | 显示全部楼层
    压缩为dict.dz的词典golendict搜索不到呢。。
  • TA的每日心情
    开心
    2018-5-11 06:17
  • 签到天数: 208 天

    [LV.7]常住居民III

    发表于 2014-2-15 11:15:32 | 显示全部楼层
    这个提取的软件感觉还是不错

    该用户从未签到

    发表于 2014-2-25 17:54:11 | 显示全部楼层
    谢谢,正需要...

    该用户从未签到

    发表于 2023-5-11 13:09:20 | 显示全部楼层
    很有用,感谢楼楼主分享
  • TA的每日心情
    开心
    2022-11-4 12:45
  • 签到天数: 20 天

    [LV.4]偶尔看看III

    发表于 2023-12-9 14:47:11 | 显示全部楼层
    我怎么看不懂的,goldendict不是直接就支持mdx词典的吗?
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-31 21:36 , Processed in 0.061097 second(s), 8 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表