掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 9669|回复: 13

[教程] 图片版字典根本不应该制成mdx格式

[复制链接]
  • TA的每日心情
    擦汗
    2023-9-2 09:16
  • 签到天数: 1103 天

    [LV.10]以坛为家III

    发表于 2014-5-29 00:29:44 | 显示全部楼层 |阅读模式
    本帖最后由 spoony1971 于 2014-5-29 00:36 编辑
      H7 P3 T6 U% J/ e1 W  ?) ]7 U6 G2 J. ?+ G2 i7 d: n
    我没用过mdx格式的图片字典,但想来制作繁琐,文件超大,使用起来缩放也很不便。其实所有的图片版字典有个更好用的方法,制作也很简单(只要另制一个索引文件即可)。4 ~" V' G1 d# Q" F
    - r7 O4 a* g7 i
    方法如下: : Y7 J# n/ ~" A0 L1 E
    1。保持原有图片字典,pdf也行,djvu最好。- V% d: a+ r) I  X! t# ]1 }, g" L
    2。建立索引文件,我用的格式是$ }6 L6 P+ x4 Y( U5 q
    词条1 页码1
    8 `0 L5 J7 C8 j  w词条2 页码2
    : a- u9 s( `1 T。。。。& e5 {9 X& F3 F; G1 \4 V( E
    3.简单script直接调用文档阅读器(我用zathura,通吃几乎所有格式)0 k5 g: f0 U% p+ o8 Z7 {. C+ t* N: U
    4。使用方法及效果 (dmenu & zathura情形下查字操作步骤): A9 w$ F. j9 z4 W* m
      alt-p调出菜单条,输入"gxhz 克", 故训汇纂“克”页面立即以最佳方式全屏显示,可使用文档阅读器所有功能。

    该用户从未签到

    发表于 2014-9-9 10:52:59 | 显示全部楼层
    chigre3 发表于 2014-9-9 07:42; o9 w  y3 a. I* K9 Z) ^+ H
    1. 拉丁字母类索引:1 l$ y7 d8 y0 r/ P
    (1) 每页左右两列末词条, 即使没有也作标记;
    " E! @. t7 _, L- R7 Q (2) 将蓝本的索引进行合理排序 (E ...

    4 A" f, ~: K& l/ |" {感谢回复。
    $ d% A; M& p3 N无论怎样做,词典中的所有索引单词都要手工录入一遍才行吧。' H& o; Z( l8 y, J4 t# S1 E
    我自己做图片词典是最笨的方法:
    : D9 ]$ b2 T% n) w& B. n& ]1.裁剪图片,裁剪过程中图片命名为0001,0002,0003.......; I/ C$ A: j* ^$ Y' m' V/ w3 P
    2. Excel表格,在一列中手工输入索引单词(工作量非常大),另外一列中是图片代码与索引相对应。
    % s  G# O( k: a- o" s& e- N$ `9 I, w3. 整理到txt文本中,转换为MDX,MDD词典文件

    该用户从未签到

    发表于 2014-5-29 09:16:14 | 显示全部楼层
    1 b; o% ~. |: ]- \9 Y+ f# m  j
    无所谓应不应该“做”,只有做与不做。
    % l  `. O5 p+ k$ g0 _图片版词典做成mdx格式的优点。5 P2 Z+ S! G) z
    1. 无错:人工录入版可能有错,如《汉语大词典》等汉语词典,还存在编码、简繁转换的问题,部分汉字显示不出来,而图片版内容和纸版一致;# I8 l* e% g' B* C8 h8 \
    2. 联合:图片版mdx可以和其它词典联合起来使用,比如您提到的《故训汇纂》,按照您的使用方式,不能同时看到《汉语大词典》、《汉语大字典》、“汉典”、《现代汉语词典》、《现代汉语规范词典》等词典的内容吧?如果都有mdx格式,则可以同时查阅了。1 @" r8 {0 ^3 D  Y7 g- W% X

    ' `  ^" I) A8 y/ }. ~======! y: @) f2 m5 U/ v7 M: O
    至于制作mdx图片版,没有调查就没有发言权。; k; O" Z' |" y( q5 `2 q
    1. 实际工作量其实不比给pdf加详细索引大,我去年利用网络已有的低清《英汉大词典》(第2版)扫描件,做过一个dsl版本的图片版《英汉大词典》,耗时约8小时;
    / {! h  I5 D# f$ f( E2. mdd大小比pdf还小。( I6 }2 ~( X+ ~- i/ t, A6 W9 X$ q
    + E; S/ }& X8 Z
    目前在制作的高清《英汉大词典》(第2版)图片版mdx,主要工作量在图片处理、索引校对上。
    / C+ e! T9 [# a
    " H; a2 u2 W: \+ s

    该用户从未签到

    发表于 2014-5-29 10:42:08 | 显示全部楼层
    Oeasy 发表于 2014-5-29 09:16 8 A; M0 g, V8 Z: a% S2 m
    无所谓应不应该“做”,只有做与不做。
    4 q8 y( }7 S4 x+ j. ^8 e8 x图片版词典做成mdx格式的优点。. V# i$ h) E4 [8 P* L
    1. 无错:人工录入版可能有错, ...
    : \0 E' |2 s4 G
    早就该考虑图片版了,排版显然是出版级别的,关键是索引。
    0 f3 {$ i! u% W) [9 r" h! g5 D+ t
    - ?  l+ s/ e2 \; I/ m% }+ h2 D图片版要定位到每个单词应该是很困难的,而且工作量会很大。例如英汉大词典。
    1 o$ c7 [, }+ ?6 w5 W
    9 l7 j- O8 C* i+ }2 w* Y可以考虑定位到单词所在的页面,找到页面后就可以依单词排列顺序找到你要查询的单词,我们查询纸质的新华字典时不就是通过部首或拼音找到所在页面然后在页面中寻找那个我们要查询的字吗。这样的话英汉大只要做2000多个页面的命名就可以了。
    , A5 W5 E1 S; l( C; R4 r0 n+ M2 n! i6 n
    假如某个页面第一个单词是category,最后一个单词cause,那么就以   category,cause   命名这个页面,不用担心索引会找不到该页面内的其他单词。你输入页面中的cattle的时候,索引自然会定位到这一页。
    , A( B0 j& x2 Z; w8 D, g, L# U) i( m2 B* ^0 ~* W! k$ k: j3 g
    还记得论坛里发布过的同义词词典吗?那种词典的制作就一定要把多个单词集中在一个页面,图片版的词典也是一样的,只不过我们可以偷懒,不用输入整个页面的单词。* v2 m/ n8 ?2 s# c0 N

    " c/ a  a, U& E# g$ y/ ?2 t另外根据英汉大词典的排版特性,我们可以将单个页面文件切割成3个小的页面(这得命名6000多个页面),这个更有利于查询,定位到页面后你只要顺着一列找就可以,不用同时找3列。而且一列图片的宽度非常适合现在4寸以上大屏幕手机,可以相当清楚的显示。基本上只要上下拖动,不用放大缩小。
    1 s* \  S; D6 D; o% B
    9 g( a4 ]  {) w# L' U' J对于某些单词横跨2列的情况,我觉得同一个单词不应该重复命名2个页面,除非这个单词横跨3列。
    1 A' k# f* q  E& r2 h
    ( B  g( J& e/ [- v这种方法试用于所有词典,不一定要有扫描仪,照相机也可以。重点是图片素材一定要整整齐齐,这样才可以批量切割成小图片。别只盯着英汉大。{:5_227:} $ ]9 ~, A$ O$ I9 H
    希望大家探讨更加偷懒的方法。
    7 n( K: o) g6 n, U
    6 f/ A8 w8 S- L. _3 h+ E& y( N之前手工录入过英汉大词典仅仅1张,实在没这个心了。望Oeasy谅解。

    该用户从未签到

    发表于 2014-5-29 11:34:28 | 显示全部楼层
    zathura是linux下的软件. windows没有啊
  • TA的每日心情
    擦汗
    2023-9-2 09:16
  • 签到天数: 1103 天

    [LV.10]以坛为家III

     楼主| 发表于 2014-5-29 13:26:31 | 显示全部楼层
    plop 发表于 2014-5-29 11:34
    5 G' Z8 z$ m6 }zathura是linux下的软件. windows没有啊
    , N* q) j0 w! U! p, f  E% H0 ~
    不一定要用zathura,任何文档阅读器都行

    该用户从未签到

    发表于 2014-5-29 16:32:26 来自手机 | 显示全部楼层
    不太懂,不会用。

    该用户从未签到

    发表于 2014-5-29 22:44:48 | 显示全部楼层
    sou111 发表于 2014-5-29 10:42 7 [4 d& _+ d0 A3 |
    早就该考虑图片版了,排版显然是出版级别的,关键是索引。
    , {  S+ i/ k3 M: z' D+ ]
    3 R5 n5 Y+ A( }2 L图片版要定位到每个单词应该是很困难的,而 ...

    4 U# w$ }9 C/ I  M( k% w也就对英汉大这类词典有效。
    " U+ v4 m& _3 X0 c如果是日语类,假名索引还没什么,汉字索引就挂了{:5_227:}

    该用户从未签到

    发表于 2014-6-1 17:26:35 | 显示全部楼层
    如果不能全文检索的话,不如直接去买印刷版。
  • TA的每日心情
    开心
    3 小时前
  • 签到天数: 1938 天

    [LV.Master]伴坛终老

    发表于 2014-6-4 10:02:52 | 显示全部楼层
    图片字典是看个人喜欢,论坛的C大就一大堆图片字典。都自己制作,切割...& u5 i1 @4 W7 i, J2 o* d% \
    图片字典就是与纸板字典差不多,纸板同样没有所有全文搜索...
    6 X( R% u9 ~2 t0 e% Z自己制作一个索引,搜索起来绝对比制作成pdf比较快。除非你自己开一个支持pdf书签搜索功能...
    $ I; \! i, Z: ^& i) c& E而且图片字典制作比手动录入快而且不容易出错...
    . j8 y7 m3 Y; s不会有什么字符编码问题...

    该用户从未签到

    发表于 2014-8-13 08:52:47 | 显示全部楼层
    本帖最后由 chigre3 于 2014-8-13 08:56 编辑
    + [2 P% o/ D! y' j) O( z4 B' l, a; G7 t/ s+ S, r/ ~

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2014-9-8 21:09:59 | 显示全部楼层
    0 E8 J$ q$ n% |
    能否告知制作这个图片词典的详细步骤,不胜感激!

    该用户从未签到

    发表于 2014-9-9 07:42:49 | 显示全部楼层
    本帖最后由 chigre3 于 2014-9-9 07:44 编辑 ' s9 A, ~" x4 f( n
    fedor 发表于 2014-9-8 21:09! U! c* @* b, }2 k1 B; R1 Q
    能否告知制作这个图片词典的详细步骤,不胜感激!

    3 ^, H' R, A8 d9 z3 H
    ; s# H/ ^, S# D2 Z1. 拉丁字母类索引:$ ]2 K0 I9 t, g/ R: o" p" }
    (1) 每页左右两列末词条, 即使没有也作标记;- ?- _  ]5 w6 Q* ^
    (2) 将蓝本的索引进行合理排序 (Emeditor);1 i+ H  O- y( o/ Z- Q) Y
    (3) 在Excel将(1)的末位词条与(2)的进行匹配, 嵌入标记, 得到初步与页码对应的所有词条索引;
      A9 Z; O# g, ]8 m/ e$ \7 g) C/ E (4) 对(3)进行精细删减和增加, 得到100%索引
    ' i: y6 ^! |5 t& g
    " E- g1 S$ I. P; A2 d; a2. 图片版制作:
    . N$ \  j5 b7 W% h& U (1) 处理1.(4)索引, 得到行号与页码相一致的"页面索引" (两列标记均在);
    ) X. w# j$ `+ f7 ~$ b (2) 处理1.(4)索引, 得到词头与页码对应表, 进行页面内词头两列分别自动序号;
    1 |4 i1 }* I+ a- J7 o (3) 对(2)与(3)进行匹配, 得到(2)词头对应的页面索引;0 a* Q+ a! }' h6 z! T) u. u9 d4 D
    (4) 制作页码与图片对应的索引 (Excel, 注意没有0000页, 也没有最后一页+1页);
    4 L( X0 q/ f# W( l, k$ W! P' J2 f+ G (5) 复制(3)(4)内容到Emeditor里, 进行排版处理 [颜色表示: 男左女右=蓝左 红右]* O9 Z: D( q. z3 `
    ----------------------------------------------------
    # j$ D9 f- x  M$ Q( [4 e" @. S. h0 hejemplo' E" S5 Y8 F3 Y  ]$ L" s
    16 ejemplo/ v& ]/ g4 _" a  r7 B, W
    【⇐ 左 _nDEC_0565】1 egotismo / 2 egotista / 3 egregio, gia / 4 egresado, da / 5 egresar / 6 egreso / 7 eh / 8 eider / 9 einstenio / 10 eje / 11 eject / 12 ejecución / 13 ejecutable / 14 ejecutante / 15 ejecutar
    0 A! N6 r( `2 a! \! s  X. i* t【右 ➔ _nDEC_0565】1 ejecutivo, va / 2 ejecutor, ra / 3 ejecutoria / 4 ejecutoría / 5 ejecutoriar / 6 ejecutorio, ria / 7 ejem / 8 ejemplar / 9 ejemplaridad / 10 ejemplarizador, ra / 11 ejemplarizante / 12 ejemplarizar / 13 ejemplarmente / 14 ejemplificación / 15 ejemplificar / 16 ejemplo
    , g( }4 m# ?7 Q) |●●●●●←上一页〈_nDEC_0564〉   下一页→〈_nDEC_0566
    7 X# b0 L. l9 o+ O[图片0565]
    % d$ U7 ^9 z1 O$ n2 h' Y●●●●●←上一页〈_nDEC_0564〉   下一页→〈_nDEC_0566

    该用户从未签到

    发表于 2014-12-27 00:16:25 | 显示全部楼层
    实在是没办法的办法啊,出版社不给力
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-18 11:31 , Processed in 0.123129 second(s), 11 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表