掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 44437|回复: 61

[教程] 图像版mdict字典制作方法

  [复制链接]

该用户从未签到

发表于 2015-2-13 09:30:10 | 显示全部楼层 |阅读模式
本帖最后由 tsiank 于 2015-10-27 01:44 编辑 7 H5 [* a  a4 W
$ T6 y( k! ^! E! g( o+ l( M- P
此贴原在国学数典发过,有网友因为注册等原因在上面看不到,所以就在此论坛转贴一下,不足之处请指正。8 o+ @0 C" {5 p* P& A/ e
0 m$ e3 j$ x& J) a( v
图像版mdict字典制作方法, f3 r( C1 l% r- c# U* ?2 Y
; f) X& \. R+ J, x" I
本人不才,先后制作了《汉语大字典》、《汉语大词典》《王力古汉语字典》等图片版的mdict字典。现在应网友的要求,将其制作方法发布出来,希望能有同仁制作出更多的汉语或其他语言的字典。
+ T2 O) j2 B% M' L8 a( ^& d2 ~/ x; c- |7 J- c0 C# J
制作mdict字典的图片版,要有两个前提:1,比较清晰的电子书;2,有字头与页码对应的数据。几个工具:电子书转图片工具:Pdg2Pic ,DJVUTOY,或adobe acrobat pro ;) W7 O: R  Z$ T1 k2 ^
文字处理工具:excel和支持正则表达式的文本工具,这里我用EmEditor;生成mdict字典格式的工具:MdxBuilder。
" H: ^5 a3 ?) D; C  O: ~$ n+ G# a) j4 y& h9 p) X$ x0 ?
下面以制作王力古汉语字典为例,说明其制作过程:
5 v* z6 w2 ~* A, G* G% x1,        将电子书拆分为单页图片。' y( t! A. G  J% {
现有的电子书格式一般有PDG,DJVU以及PDF,制作电子字典,一本书有好几种格式的话,首选PDG格式的。因为用这个格式转成的png图片,不仅清晰,而且尺寸刚好合适,可直接在苹果设备中使用(ios中mdict电子字典,其图片尺寸若超过2400*2400便无法显示)。
  V0 M; T) A2 `% @% C2 w$ c
* ?& q3 P/ V( S+ B5 R+ m如果电子书是PDG格式的,用Pdg2Pic这个工具转为png,如图: ; \+ f$ Y6 Y" \9 O' C* k

- I+ O- C) V7 Y+ j2 z. ?6 c8 W5 p& `# @) _! h9 B6 v
那个参数设置只需选图像存为png就行,其他不用变。生成图像后,可以根据需要用文件批量改名工具修改一下文件名,也就是页码。比如我们把正文的页码(也就是以纯数字开头的文件)放在一起,图中的页码都是6位数的,将其改成4位数,并在文件名前加几个字母(这里加个WLG)以与其他字典的页码相区别。如图:
8 [  A4 W% s  l% q+ v. h7 n/ z' C7 Q9 o0 z' ~- e. a( S

/ G' x$ m0 M; ?- a" a! r/ v  x# k5 q
  ^( @4 U( E5 ]1 B0 Y9 V将附录和其他的页码放在一起,根据需要进行修改,比如也改成4位数并在前面加上WLGF几个字母,方法同上。
3 R, V: W7 k$ w
0 e  Z. }+ g, F. l! {) t; M0 u如果电子书是DJVU格式的,用DjVuToy这个工具中的转图像选项转为png。
7 t. T7 C; s' o" Z
' a! X6 _+ {. [
0 ~4 _. L& M0 S& m4 S如果电子书是PDF格式的,那可以用adobe acrobat pro直接导出为png。: k3 e9 O5 Z2 n' k
需要注意的是后两者转换后的png尺寸并不一致,生成的mdict可能会在ios上无法显示,如果想在ios上使用,就需要使用另外的图像处理工具调整png的尺寸了。
; E( X; n* d& @* [
: J) D1 {5 P6 S3 i. |2,        页码的处理:: n, b. A2 S+ I
首先,在excel中根据字典正文的页码数输入一列页码数据,原字典是多少页,这里就输入多少个(王力古汉语字典正文页码到1817页)。然后将此列数据分别复制一份到B列和C列,在B1插入一个空单元格,数据与B2同。把C1删除,并在C列最后一行的单元格输入与上个单元格相同的数据,最终数据如图所示:& G+ z$ ?' y& M4 N/ T1 I# W

0 m! C! h+ C0 o- ?9 b7 `' K
4 c$ Z* T; R! u' x- B将此三列数据复制到EmEditor中,点击搜索-替换选项,勾选使用正则表达式,在查找栏中输入“(.+?)\t(.+?)\t(.+?)$”,在替换栏中输入“WLG\1\n<img src="/WLG\1.png" width="1080px"><br><center> <a href="entry://WLG\2">上一页</a> &nbsp;&nbsp;<a href="entry://WLG\3">下一页</a> \n</>”,然后点击替换全部,结果如图所示:$ j8 X: u' m7 O0 ]# C' ~2 ^

) Q( s1 H7 ?' Q3 }) x" t2 l最后将这个文件以UTF-8的格式先保存。/ q# X* c$ m. z

1 o4 o  s6 y0 d* {
3 j0 y1 y/ ~( p7 h对于附录以及其他页码的处理同上,只不过替换中的WLG三个字母要改成WLGF,处理完毕后将其文本复制到已保存的王力古汉语字典.txt中并再次保存。! Z. Q: \7 o# O2 f  |+ t, j

1 B  k) W. c. X0 K3,        字头的处理:
1 \2 x( c. f4 X9 J. @+ B( ], s1 _将字头与页码在excel中整理成如下所示:1 [/ _/ c& H( j7 F! Q5 C/ e
2 u; z) K# R# D- z- e
将其复制到EmEditor中(首行不要),在查找栏中输入“(.+?)\t(.+?)$”,在替换栏中输入“\1\n@@@LINK=WLG\2\n</>”,点全部替换,结果如图所示:
! V/ J  h: p! j: r, l & c) H$ d" E+ s  E4 J
将其结果复制到王力古汉语字典.txt中,注意与前面的内容不要有空行,点击保存。这样文本就处理完毕了。
7 t/ S, O) X* p2 R
5 c# e5 z' n+ Z/ D4,        转换成mdict格式的字典。* j) Y5 _& t  K0 l# r/ ~  E
打开MdxBuilder.exe,在source栏中输入刚才保存的文本所在路径及名字,在target栏中输入要生成的mdict格式的字典所在路径及名字,扩展名是.mdx,在data栏中输入第1 步制作的图片的所在位置。original format选择mdict(html),encoding中选择UTF-8,title栏输入这本字典的名字。description栏是这本字典相关信息的描述,支持html标签,也可以不填。其他选项用默认的就行。然后点击start开始生成mdict字典。如果status栏最后出现successful 字样就说明制作成功了。
3 i1 G6 _# `8 t
* V$ p0 W; k1 L5 L ) i) I7 @' M2 n

, ]" e/ w& Z) r8 v: S3 j3 \5,        mdict电子字典的使用。& J$ _7 B/ L' Y
PC端支持mdict格式的电子词典工具有mdict,goldendict,推荐使用后者。安卓端有mdict和bluedict,推荐后者。ios端的有mdict。将上述生成的mdict文件(mdx和mdd,两者文件名要一致)放入合适的目录中,并在软件中将词典路径指向这个目录来添加字典,然后就可以查询使用了。
, x+ I7 B8 J: r2 h4 U3 U ' @& X1 W3 Y% n! Y$ ?. M
4 p$ q& J* d; I9 `/ `

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

评分

2

查看全部评分

本帖被以下淘专辑推荐:

该用户从未签到

 楼主| 发表于 2015-2-13 09:31:49 | 显示全部楼层
图片都不能全幅显示

该用户从未签到

发表于 2015-2-22 21:56:09 | 显示全部楼层
本帖最后由 fedor 于 2015-2-22 22:10 编辑
3 _- u, v% y2 z4 D
liuyunrushui 发表于 2015-2-20 22:42* a, w2 A% b& c- o: i
字头没有弄明白啊,是将每张图片的那些字作为索引字头啊?!
/ ~$ Z( Z" {: Y& u1 Q, V* ^7 C$ s$ h
字头是将每张图片的单词作为字头的,后面 ...

3 T% T2 K; X8 T/ O) A) K" y2 u2 R+ y2 _! R+ C  z# l$ }+ n. o
又尝试做了一下,成功了。5 H) V  g1 ~# S! b# M4 Y
每张图片上的所有单词都要做索引,也是比较耗时的,这还是其次,问题是图片大些的词典在手机上就无法用了,在电脑上用还是可以的,mdict中启用图片自适应窗口,字太小,开不清单词,而如不自适应窗口,图片又太大,浏览起来特费劲,所以说还不如先裁剪大小合适的图片,这样在手机和电脑上都能用,就是费时间。
; r5 @$ u) s% Q$ C0 C  x7 {+ ?9 H还有个问题是,将词典放在GoldenDict上应用时,没有“下一页”的显示,只有“上一页”显示,而且还非常的小。
' u% J7 J9 n% d, H. K" a! j% m. {下面我做的词典,在手机上的应用和在GoldenDict上应用
4 [# K; L) o2 e! c截图软件为FastStoneCapturecn。
: H; b; r6 |  O. Q+ g3 J
$ g* p, i) u3 C6 m: t* U9 ^9 p( @5 m7 }2 K' @
, k( v' g+ D1 D, K8 `) ]/ R7 W" I* [

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x
  • TA的每日心情
    开心
    2023-7-5 21:21
  • 签到天数: 399 天

    [LV.9]以坛为家II

    发表于 2016-10-3 08:53:16 | 显示全部楼层
    有点遗憾 根本看不懂啊!1 C* V( _1 ~/ T8 n* i$ c
    将此三列数据复制到EmEditor中,点击搜索-替换选项,勾选使用正则表达式,在查找栏中输入“(.+?)\t(.+?)\t(.+?)$”,在替换栏中输入“WLG\1\n<img src="/WLG\1.png" width="1080px"><br><center> <a href="entry://WLG\2">上一页</a> &nbsp;&nbsp;<a href="entry://WLG\3">下一页</a> \n</>”,然后点击替换全部,结果如图所示:
    * `9 O- j& Y' }# D这三列数据复制到Emeditor后,也就是那三列数据,哪来的“(.+?)\t(.+?)\t(.+?)$”?不能替换!本人比较笨!教程个人觉得不详细!在excell中输入数字时,按楼主的做法,B列会多一行,请问这最后一行的数字是保留还是删除呢?3 R! k  z3 e& l5 O- t. D- a2 r

    点评

    B列多的一行并不能替换,应该还是要删掉的  发表于 2016-11-29 14:56

    该用户从未签到

    发表于 2015-2-13 10:11:12 | 显示全部楼层
    终于看到图片了~!!!点开可以看到完整的~!非常感谢~!
  • TA的每日心情
    慵懒
    2023-10-14 18:34
  • 签到天数: 210 天

    [LV.7]常住居民III

    发表于 2015-2-13 12:41:30 | 显示全部楼层
    tsiank 发表于 2015-2-13 09:31
    8 z5 I0 O, T8 g9 ]2 J) ?7 k图片都不能全幅显示
    ; H9 _0 J( o, P
    先传到相册,然后在贴子里引用,就能全幅显示了 :D

    该用户从未签到

    发表于 2015-2-13 16:15:18 | 显示全部楼层
    支持原创教程!3 K4 T9 H, @9 K* n& I

    ) a) _: R+ w% t# x5 ?Pdg转png是关键,很多pdf或mdx的图片质量很差,估计就是转成了jpg格式。

    该用户从未签到

    发表于 2015-2-16 01:33:27 | 显示全部楼层
    本帖最后由 chigre3 于 2015-2-16 04:36 编辑
    3 h& Y, Y. b, Q# t( t, Y* B3 c- h- f, J
    汉语词典单页上一般词头不多, 容易定位, 对于其他语言 (如英语, 意大利语, 西班牙语等) 就需要更进一步处理把所在页面的位置(序号)标志出来.
    ' q) ?; _$ F$ |8 \  \之前也简略说过这事情:
    0 V8 {0 D) a8 L1 _# G图片版词典的大致样子  https://www.pdawiki.com/forum/fo ... hread&tid=13169

    该用户从未签到

    发表于 2015-2-16 01:35:03 | 显示全部楼层
    我觉得论坛其他朋友对于图片版词典不够重视, 制作好的图片版词典实际用途也很好啊!7 Q7 e) S' u  k- k# K
    (因为没有文本版的)
    + a- m1 H+ o. m/ w
    + F  e$ f  q& t2 h4 Z/ g谢谢tsiank的帖子, 还有你制作的几个词典!

    该用户从未签到

    发表于 2015-2-16 14:45:38 | 显示全部楼层
    chigre3 发表于 2015-2-16 01:33
    5 H0 X! @9 L. D/ ~! t汉语词典单页上一般词头不多, 容易定位, 对于其他语言 (如英语, 意大利语, 西班牙语等) 就需要更进一步处理 ...
    1 M$ E6 [' [1 ~( d6 R
    求详细教程讲解~非常愿意学习~
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2015-2-18 17:53:52 | 显示全部楼层
    感谢老大,请问一下,用您的教程制作的辞典,在手机上可以放大浏览,但是不可以缩小浏览是何故呢?
    - S! Z: L* V; ^5 g, G6 w- Q4 M能否赐教呢?' W8 a: I% ]7 W  x: i! j4 r
    手机上使用的是mdict软件,用深蓝好像也是不能缩小,可以放大,用于手机屏幕限制,所以想缩小一点浏览下!
    $ }. C( ^0 ]" ^" ~7 k# E
    " V" ?) O" a1 l; e% Y, O1 D/ |

    该用户从未签到

     楼主| 发表于 2015-2-19 13:31:52 | 显示全部楼层
    liuyunrushui 发表于 2015-2-18 17:535 T; S9 H" h2 g6 ^3 ]
    感谢老大,请问一下,用您的教程制作的辞典,在手机上可以放大浏览,但是不可以缩小浏览是何故呢?
    " z8 ]  M6 {' T9 d' T2 P/ g能否赐 ...
    % P6 z& X7 n4 O; C( `( l* ?2 W
    把width="1080px“这个1080px换成适合你手机的数即可,比如换成720px或者100%什么的。
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2015-2-19 16:40:00 | 显示全部楼层
    tsiank 发表于 2015-2-19 13:31: q, q6 |' f" [3 }0 q
    把width="1080px“这个1080px换成适合你手机的数即可,比如换成720px或者100%什么的。

    * ^$ [) a) b* Q$ D非常感谢大大!!!!! Q/ t/ N$ g9 M' ]# ~' d
    新年快乐!

    该用户从未签到

    发表于 2015-2-19 20:36:52 | 显示全部楼层
    本帖最后由 fedor 于 2016-5-26 18:43 编辑
    - C7 z. |( x8 f/ K, [/ b+ ~
    ( q) F( N6 y( h+ _9 Z# ~" ~尝试照着描述做了一下,没有成功,主要是没有明白字头的处理的描述,两列的表格,左列为字头,右列为字头所在的页码,也就是文件名称吧,字头没有弄明白啊,是将每张图片的那些字作为索引字头啊?
    & v' e# h% F/ r5 R: ~; K' E我也非常喜欢制作图片词典,但都是最笨拙的方法,首先裁剪图片,大小要合适,其次是将每个单词都输入到表格中作为索引,这里无论是裁剪图片还是做索引,都太耗时间了。但好处是做成之后,输入即可查询定位。
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2015-2-20 22:42:10 | 显示全部楼层
    fedor 发表于 2015-2-19 20:36
    $ X# _. }) q1 D. w( w尝试照着描述做了一下,没有成功,主要是没有明白字头的处理的描述,两列的表格,左列为字头,右列为字头所 ...
    - q0 g5 t7 i8 L) N
    字头没有弄明白啊,是将每张图片的那些字作为索引字头啊?!
    * o+ J8 S! N" s
    , S( n5 D* v0 z字头是将每张图片的单词作为字头的,后面一列的页码是同一页。我按照楼主大大的方法成功了!
    9 [9 G, k& ^; @; _7 |- f3 M1 c0 h: [2 ]3 d1 Q6 S: k
    一张张切图片,阅读起来很方便,但是很费时间呀!
    : l. a$ g0 E7 C; P! g/ y6 ~! G+ ]
    ) P! }. k$ l+ _$ p+ I能请问一下您是用什么软件切的图片吗?

    该用户从未签到

    发表于 2015-2-23 09:27:59 | 显示全部楼层
    请教大神,在手机(小米3)图片词典浏览无法看清单词,字体太小啊,如何解决啊?我将1024px调整为100%了,显示效果如下。* |1 {) s& I" v9 p/ x

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

     楼主| 发表于 2015-2-23 10:38:38 | 显示全部楼层
    fedor 发表于 2015-2-23 09:27! X) D) c& r( ^/ L. ~, A
    请教大神,在手机(小米3)图片词典浏览无法看清单词,字体太小啊,如何解决啊?我将1024px调整为100%了, ...

    / w7 U+ W4 E( C! y0 @/ f/ \7 m) M手机上看这种双栏的图片,我看还是放弃吧,来回不停地放大缩小,太麻烦。 要么就把这种双栏图片切割成单栏的,和我汉语大字典手机版那样的。
  • TA的每日心情
    难过
    昨天 07:55
  • 签到天数: 1609 天

    [LV.Master]伴坛终老

    发表于 2015-2-23 21:22:33 | 显示全部楼层
    文字版的还没学会

    该用户从未签到

    发表于 2015-2-24 10:12:17 | 显示全部楼层
    tsiank 发表于 2015-2-23 10:38
    5 X$ G8 q% D6 g3 s手机上看这种双栏的图片,我看还是放弃吧,来回不停地放大缩小,太麻烦。 要么就把这种双栏图片切割成单 ...

    7 l9 j- O4 D) c; t, q感谢回复!
    # e/ q+ X7 Z' E1 |% e) S还有个问题,词典放在GoldenDict上应用时,没有“下一页”的显示,只有“上一页”显示,而且还非常的小,这是怎么回事?如何调整?

    该用户从未签到

     楼主| 发表于 2015-2-24 13:28:48 | 显示全部楼层
    fedor 发表于 2015-2-24 10:12
    , r6 r6 |& g; K- z( T感谢回复!
    7 s! ]# N( f, j# k还有个问题,词典放在GoldenDict上应用时,没有“下一页”的显示,只有“上一页”显示,而且 ...

    / a9 t0 w, n; H: N- k1 n& x不好意思,由于我的粗心,在“<a href="entry://WLG\3">下一页</a> \n</>”这个代码中,>下一页  的前面少了一个"号,导致在goldendict中不能正常显示下一页,现已纠正。你可以把你做好的源文件用EmEditor打开,在查找栏中输入“>下一页",在替换栏中输入“"\0”,然后点击全部替换即可。

    点评

    不对,楼主已经纠正过了。我前面复制的代码应该是没错的。我的问题是点击下一页不是跳到下一页,而是跳到下一个词条那里。  发表于 2017-8-7 08:04
    刚看到这里,感谢纠正!  发表于 2017-8-7 07:52

    该用户从未签到

    发表于 2015-2-24 16:29:55 | 显示全部楼层
    tsiank 发表于 2015-2-24 13:28
    , h* a* }/ A/ A, v  N5 p0 |- F" |不好意思,由于我的粗心,在“下一页 \n”这个代码中,>下一页  的前面少了一个"号,导致在goldendict中 ...
    ! G/ o) o: Q9 k
    非常感谢!!!
    : [# O1 L# b5 t% }这回正常了。以后有问题再请教大神

    该用户从未签到

    发表于 2015-2-24 17:41:15 | 显示全部楼层
    tsiank 发表于 2015-2-24 13:28
    ! P) G! U- u8 e, j4 s2 s; U. D/ y不好意思,由于我的粗心,在“下一页 \n”这个代码中,>下一页  的前面少了一个"号,导致在goldendict中 ...
    7 `* R% X0 t# d3 r6 d2 J& {
    不好意思,还有个问题想请教一下
    5 _" O( Z8 Y7 [9 h, [' P在PDF中用截图工具截取图像另存为png格式的,做出的词典正常浏览(电脑中浏览)。5 b7 X+ R7 ?' [# I
    但是PDF转为png的,或者用XnView软件统一将图片都调整为png格式的,做出的词典却浏览不出来,这是怎么回事啊。
    9 t+ K3 y7 s9 \% E+ _" n3 k也就是说,只能是截图另存为的图片才可以浏览,而用原来的图片或PDF转换过到png格式的,都不能浏览。

    该用户从未签到

     楼主| 发表于 2015-2-24 17:55:28 | 显示全部楼层
    fedor 发表于 2015-2-24 17:419 A! t. C. E# v
    不好意思,还有个问题想请教一下+ F( @+ D, E) W) ?- F1 a3 B( ?
    在PDF中用截图工具截取图像另存为png格式的,做出的词典正常浏览(电脑 ...

    4 f; M+ r# g8 r" Y我没遇到过这样的问题。你是怎么把PDF转为png的?可否上传一下让我看看?

    该用户从未签到

    发表于 2015-2-24 19:28:14 | 显示全部楼层
    本帖最后由 fedor 于 2015-2-24 19:31 编辑
    ( ?; @% K* e7 K' q% _! k
    tsiank 发表于 2015-2-24 17:55
    6 {, [7 K: H$ `9 A- a( S2 |我没遇到过这样的问题。你是怎么把PDF转为png的?可否上传一下让我看看?
    0 _6 P! k" g9 \3 j
    % @9 b% \6 _) j3 m' o( Q* j
    本想发给你你看看的,
    6 W  I. p+ G# [+ a9 J# f8 t/ b# d8 g但一下子又好了,问题也不知出在哪里。( ~3 e1 m  m( h/ G9 o. `' u
    不过最后一次是这样做的。
    1 l. a* G1 u  j我的原图是pcx格式,用XnView转为png,就正常了。/ }- Z% G/ V9 z- ^1 {

    ; B. J" c! j# x3 n. r' d, m/ N% x对了,有没可以将两栏的词典拆分为一栏的软件呢?而且不影响原来图片的清晰度,给推荐下。

    该用户从未签到

     楼主| 发表于 2015-2-24 20:55:56 | 显示全部楼层
    fedor 发表于 2015-2-24 19:28
    # A7 n. n+ D. C' u本想发给你你看看的,
    / J5 f) u' b- y2 v但一下子又好了,问题也不知出在哪里。! H# B5 W+ Y7 f9 U3 @; k3 T" ^
    不过最后一次是这样做的。

    6 i9 n7 M& N3 o$ v; t8 DComicEnhancer Pro:http://www.comicer.com/stronghor ... tm#ComicEnhancerPro

    该用户从未签到

    发表于 2015-2-24 21:08:58 | 显示全部楼层
    tsiank 发表于 2015-2-24 20:553 M1 |0 o6 I  L
    ComicEnhancer Pro:http://www.comicer.com/stronghorse/software/index.htm#ComicEnhancerPro

    ! r; z2 j" d  }6 W$ H$ t感谢,下来试试
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-29 05:09 , Processed in 0.064223 second(s), 12 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表