TA的每日心情 | 奋斗 2019-10-13 07:34 |
---|
签到天数: 209 天 [LV.7]常住居民III
|
本帖最后由 VimVim 于 2020-6-28 16:01 编辑
/ u" i( ^! ~) n0 R$ O3 I9 l" S3 @( a/ N+ O6 g/ g
## 背景* t% S [% \. ~5 ?+ w: l( l
9 m1 ]6 t- p5 g5 Z k9 j+ f6 _
时常遇到好资料,怎奈只有PDF扫描版,辛苦制作好词条,但成品的导航却不够理想,梳理 e2 M% W" t6 T" ~( T; `; R
一下现有获知的工具,提出图片词典应有的标准,希望各路高手能够借鉴打造理想的工
9 d# K! U% ]1 x6 U/ c7 G% C" A具,造福广大词典爱好者。# e# M$ x3 m% r: ^2 q1 U
& C- b: k4 [7 m% j2 D$ n+ H3 D" t2 m! G; P2 f# }4 k' S
### 现有图片词典制作技术点评
+ _4 k1 p/ M% K6 Y6 U! m% I; @9 K, s
/ M% `7 m& _' C* W2 A' l0 D/ w0 ] * 图像版mdict字典制作方法 by tsiank
% w) t! e( K: L* [% } - src: https://www.pdawiki.com/forum/thread-13451-1-1.html
9 L6 C8 ?7 v, G& `, k) h - 这是最优秀的原创教程了,入门必修8 p' @3 _4 Z. D4 R* S+ B% z0 R
- 优点:理解图片词典的基本原理- w, e2 R% o$ Q9 @
- 问题:导航简陋,难以在页面中定位具体词条) \6 f! I5 Q' T+ C4 ^" W
* 图片版mdx源文件生成工具 by tsiank
+ k! L: j, M ]5 {$ p k - src: https://www.pdawiki.com/forum/thread-33574-1-1.html6 _4 q) G: [) N
- 这是上述教程的升级版,带工具了!
' T, \. j5 S/ a) z7 Q. Y+ { T( D: F - 优点:导航体验大大提升;技术门槛极低,小白都可以使用
/ R: Y; l) n: h1 i - 问题1:不能自动处理多部分构成的书籍,目前主要处理正文部分1 S6 [3 k4 Q7 |4 k/ u4 h9 i" U" H
- 问题2:生成的mdx源文件有很多细节问题需要进一步处理,如CSS缺文件名、多+ Q; m4 U9 i* _' \: `
个标签属性之间缺空格、nobomb格式等
, r' N z$ t, i, e- \& H: h' K" \ - 问题3:鉴于使用Excel,无法与其他工具链结合,从修订原始词条文件到生成
# @! Q: d3 u1 h8 i& g# {+ @ mdx源文件无法一步到位
1 A$ X, O8 P4 p% W# h. e! r - 问题4:导航依然有改进空间,VBA不熟悉,改造困难
6 I2 v4 _1 C. u% I * 以Picture Capture为代表的切图版词典制作软件 by chigre3 等9 q& m$ F: P% c
- src: https://www.pdawiki.com/forum/thread-19040-1-1.html
& n; O( J" n+ d9 G( ^ f j) r - 这是对终端词典用户体验最好的工具/ i7 z6 f# h' n. F, d
- 优点:直接定位到具体词条、导航丰富
; d' `' F1 q' U; E) B - 缺点1:工具非开源、偶尔开放下载、遇到问题没有反馈处理机制
( }) e: u' A% d; M% N - 缺点2:对于普通词典制作者来说极其复杂、体验糟糕& y, V6 r8 Z3 J$ f7 T1 @
* 使用CSS精确定位Visual词典 by 孤影 等$ j2 P# |* s9 {/ b( t
- src: https://www.pdawiki.com/forum/thread-20350-1-1.html
# r0 c2 U- X; r+ I9 w7 M - 对于Visual Dictionary词典用户来说,体验很不错
8 I: S0 { h1 r6 @9 [2 u, U% x - 优点:关键词加亮、可直接在图片上点击关键词链接
4 @0 [, s8 g* \$ R7 |/ |0 U+ {8 d - 缺点:具体技术细节不开放,仅可观摩案例Chinese-English Bilingual
! w V% F9 R8 M, N" z0 ~! R Visual Dictionary (https://www.pdawiki.com/forum/thread-35929-1-1.html ),! g* d3 O. d7 O* c
大致是先OCR图片,并通过类似Picture Capture工具切片获取每个关键词的相
5 \9 d1 N) G0 W9 s5 E8 e, i8 @ 对定位,最后使用CSS隐藏文字层并定位关键词,太复杂了
. Q; k+ N) r- ^1 ?- x |0 Z5 S* y- Z
### 优秀的图片词典工具链标准; _( T" r8 r% A; r! E- i6 t6 `' @
$ B2 j3 R$ ~% p, | c! _! b
* 词典成品的导航体验要足够好:核心是有助于快速定位具体词条位置) M; ~. L0 z4 \5 z3 ^7 d
* 词典要能够适应不同尺寸的屏幕:阅读体验好,字体太大或太小都不可取0 f4 y7 w$ P/ q6 o
* 图片处理要足够简单:使用扫描的整页图片即可,不要切片等复杂操作
1 U) m& P- I' k * 词条的录入、校对要足够简单:要一目了然,不容易出错,技术门槛降至最低
1 P; H9 V2 ] K" ^( _2 D7 W * 词典修订要快捷:修订原始词头文件后,通过工具可一步到位生成最终的mdx源文件' n; G" V4 X9 r2 Y; H
8 {# I9 ~( Y" R. g- W! |为了实现上述目标,拟根据自己制作十来个图片词典的实践经验,提出如下制作规范,大$ }% A- N9 X& p, e6 o ^3 k! F
家可将其看作是开发相应图片制作工具的用户需求文档。$ p6 f+ N- y5 ~! Y+ u0 q1 d
7 N3 r/ U: B2 X* K6 o! f4 ~
## 成品图片词典的导航构想3 V, a7 h- Y( {* u
+ }' k3 M% V* g* T7 r
* 在页面顶部显示Pages导航 和 Keywords导航(或有)4 Z) y" h9 h& j; q: O
- Pages:Previous Next Cover Preface Content Index etc.
; k! f& {9 A4 g7 [) I0 j5 | - Keywords:A B C D E F G; G& J/ ~+ h4 S1 E
* 在页面底部显示Pages导航
8 c Q! |0 g; _1 w+ j - Pages:Previous Next Cover Preface Content Index etc., R6 Z0 g9 F! K0 h3 S+ y: t% T6 t
/ _( J% @/ L9 K% p * 在Pages导航中:$ n% r5 \2 \9 [4 {! |
- 上下页,可自动处理first和last页面
# I1 f, `/ U; D0 X8 g0 @ - 上下页,可自动处理多个部分的页码体系为一个连续整体,如:
: v8 ]0 ~0 a& e l8 M - 正文前123(封面、目录等)、正文123、正文后123(索引、封底等)8 n4 s s8 a) g9 B9 W6 k. W( S Q
- 除了上下页外,可自定义添加封面、前言、目录、索引等固定链接。
" I( q1 G: t& k, d1 _& @1 I* G * 在Keywords导航中:2 ?. q7 F+ L7 L1 D5 t0 a6 i
- 若没有关键词,则不显示Keywords导航,适配封面、前言、目录、索引等页面
5 E; }- g/ D# B( w! I/ G - 若某个关键词作为mdx的keywords,即使用Keywords导航中的某个关键词进行查
6 o- \8 u) M, k6 U+ R& r) N 询,则在Keywords导航中加亮该关键词。0 m- G t8 W3 ~! w
- 若页面作为mdx的keywords,即使用Pages导航中的页码等进行查询,则在- M6 g* p# q# a* X) {
Keywords导航中的关键词不做加亮处理。
3 M% L2 f( w7 ~3 ^. X4 v Q
- u3 n% a' n' Q1 s## 源文件格式规范
: B8 h* Z& H& r% A t
4 L. K5 X( k8 G% l9 Q8 R3 k( a8 I * 图片文件命名格式:
8 F- @: d6 c t* O - 根据页码编排需要,可将书籍分为多个部分,如:正文前123(封面、目录4 d; i( J, c# k" M. T. r
等)、正文 123、正文后123(索引、封底等)
, P: c; T+ f- Y# x/ D - 对于不同部分的图片,相应文件名命名规范为“前缀名+页码+后缀名”:
7 T2 u4 y0 `; c0 X: j- x& [" U - 前导名可自定义,中英文均可,建议采用书籍英文名或拼音缩写等个性化, o6 ?& Z! O" ]7 W/ U
名称,避免多词典之间命名冲突! I! N* C( s0 H- q4 i( s7 ^
- 页码位数可自定义,默认4位,可根据需要设为3位或5位等
% k: a# r1 I& D4 F6 g - 需要正确识别图片后缀名,如jpg、png等
6 n/ B" k% N. s: A8 ]3 f9 a9 S/ W8 I/ y - 图片文件名案例:某书前0001.jpg…某书正文0001.jpg…某书后0001.jpg
' g. d7 l/ J4 o: _
7 v3 v7 F0 _' p" P3 v; F * Keywords源文件格式:; E2 b2 A" X% W& r, j) E
- 对应书籍的多个部分,将keywords源文件分为多个部分,如:正文前123.txt(封4 m |/ }$ |6 ?% ~+ t0 E& S+ ?- W/ X F
面、目录等)、正文123.txt、正文后123.txt(索引、封底等)/ l* O" u8 Q- m2 |7 m5 Y2 @ p
- 具体内容格式(极大化方便用户输入词头、校对和修订):% K- o* q0 {6 h6 |- h, i4 ^/ C# w
* 第1行页码:0001
5 m: l+ B0 u9 u * 第2行关键词:A
+ ^; S* v. Y* y8 H; e! y * 第3行关键词:B- \; B1 J$ T$ U. g2 j- s" c+ G
* 第n行关键词:N: v- Y' b0 ]. m( p0 a
* 第n+1行页码:0002
' b1 w! [9 v' Y( _. O& p: a ]: A* { * 第n+2行关键词:X
5 u6 r$ O0 e. L * 第n+3行关键词:Y
5 \& E% L( e5 b * 第n+4行关键词:Z6 w& _# `" S: d( \
* ……3 X- }; L$ H2 r
- 页码之后,可以没有关键词) \( q( u& ]8 O3 @, t
- 若有关键词,则同时生成相应的Pages导航和Keywords导航& ~/ u) U- B; k6 I1 H5 P) Z
- 若没有关键词,则仅生成Pages导航,而没有Keywords导航
, P8 T8 `" }% ?' k* t# M
( j& d$ S2 u7 A& z) w+ ^0 O2 Y## 处理程序及配置文件规范9 U5 Z' f2 p$ Q; T5 p
4 V7 k* f# C2 ?5 S+ W7 Q2 f
* 建议使用Python3,毕竟用户多,大家有能力按需改造
/ q- Y1 x9 M6 o% y: m7 T; y* g * 程序作适当配置后,应可一键生成最终的mdx源文件和css
+ T$ {* g4 t% `0 ` * 主要配置包括:
8 f# Z# |+ I/ {: k: } - 书籍多个部分对应的Keywords源文件和图片文件
Y' t6 E) D. F6 C" s% f - Keywords源文件名称
5 i' {: b8 \) Q' l% l( { - 对应的图片文件名:前缀名 + 页码位数 + 后缀名
5 h' k$ n5 ]8 V. ]: r) h - Pages导航中的自定义固定链接:1 m5 d" }! V2 j& L: z( F
- 固定链接名称(如封面目录) + 对应图片文件名
' C t; u% w0 H' g# a( E0 | - mdx目标文件名
# S0 o& w3 t: e4 L- y/ B - CSS文件名
- W" y# D+ a( q8 z8 y9 L - 导航的中英文- a A1 B& i. g
- 简中:页面、上一页、下一页、关键词; a! M, r% i: t0 |
- 繁中:頁面、上一頁、下一頁、關鍵詞7 F% \6 X+ ?" I8 b+ @: c
- 英文:Pages、Previous、Next、Keywords
" E/ m( Z' u: R7 Y% h# {( O
( @- C5 S4 l) v7 h0 i## 目标文件格式规范
) e# A7 x3 m+ P! i' d: g6 k. d" K3 a3 ^; f
* mdx源文件txt需要满足mdx源文件的格式标准:dos,nobomb,UTF-88 P2 u3 m: h; b4 {4 h6 x
* 生成的CSS可进一步配置:& M0 ^! y6 ^( H: Y' T
- Pages导航样式
; T0 u+ T B/ w3 ]1 a - Keywords导航样式7 P: t9 x8 X$ g
- 加亮Keyword样式" ~9 V+ A; z, t: u3 }9 P
- 图片宽度:百分比(默认100%)或固定大小(px或em)
2 c4 {6 U2 u9 ^8 \) [
, y5 t9 u5 U$ M4 z0 ?; q## 扩展1:整页版和多栏切片版二合一* f# [+ a2 Q2 Z7 M- l& U! p
- W! e! _/ j" ^3 F为适应手机等移动设备的查阅,需要将整页版适度分栏切片" g, B; j# \) |4 e( g5 N5 E. L
: f, p$ m# m- _; U% a5 O
* 词条需要分栏处理
8 q5 j! R* A& U; d4 J5 R * 图片文件名需要分栏处理
& r# L! l2 |5 Y( O * CSS要能够自适应不同屏幕尺寸的设备
& W/ x9 T2 [* M% @) { ?0 o4 V! n5 v/ r, x0 D+ s, {
具体改造略. X$ W9 k3 a1 G' _, d
# f9 S% T6 g) j8 s2 o R( p2 Y1 _2 u( S
## 扩展2:多层次词头优化: O1 y0 f2 e- q( [$ l/ j
$ H- L1 Q" J. n: x" d2 V: H
为优化类似Longman Language Activator、朗文多功能分类词典、现代汉语词典等词头有4 A7 t @" y) b7 ^) [2 i4 j+ d
多个层次的词典,可在原有标准基础上,进一步将Keywords区分为多个层次,如字、词:) R, E$ S. N, E' U8 |2 a# f) Z
/ Z+ q9 r& a) a3 s5 U * 在页面顶部显示Pages导航 和 字词导航(或有)
( |% A1 t+ |% a2 y3 x$ c, B - 页面:Previous Next Cover Preface Content Index etc.# Q$ \. k9 T- _) g. ]& v
- 字:A B C D E F G1 x% F& d) x. C: P9 S
- 词: WordA1 WordA2 WordA3 WordA4
7 I! s- Z) h% v, P, l * 在页面底部显示Pages导航- J+ u. {6 G4 R
- 页面:Previous Next Cover Preface Content Index etc.& [6 j$ R7 u+ H
4 M; J4 @' a& y6 e9 } * 当查询页码(并未查询具体的字或词)时,仅显示页列表/ }6 @! b. Q v( r+ [6 Z9 n
* 当查询某个字或某个词时,不仅显示字列表,还显示这个字所包含的词列表
* }" S! H( w# [2 T4 r# V9 B _8 i: [( u# \& d1 C
具体改造略' j7 R5 t9 y' m# {1 F
J. \2 g5 m9 ]0 ?
## 诚邀Python等高人打造开源的图片词典制作工具0 [) r( T) l2 V
* m6 G& |# u# Y6 ~# t. W
若能够制作符合上述标准的工具(先有标准版的即可,扩展版再逐步优化),必将造福广7 w* ~* a0 W2 H0 q! f; l
大词典爱好者,无论是字典制作者,还是字典使用者。4 y* w: U! E' Q0 d I2 x5 M% ]
- L/ ~7 v7 d. e' b0 U& s/ i& s! @若有需要,我可提供相关案例词典:包括完整的图片、词条等。! {& b8 f* \" `8 `3 J; W t
9 u2 L; ^1 n% r5 L4 M! ]
|
|