TA的每日心情 | 奋斗 2019-10-13 07:34 |
---|
签到天数: 209 天 [LV.7]常住居民III
|
本帖最后由 VimVim 于 2020-6-28 16:01 编辑 9 b/ w' _% C" @) i" B+ m' @
9 |6 i! h5 W5 M# T+ M## 背景- ^8 \, Q2 e, @' Q+ g
0 c8 J4 E; A7 m/ ~
时常遇到好资料,怎奈只有PDF扫描版,辛苦制作好词条,但成品的导航却不够理想,梳理. V: q1 }: c" u' y
一下现有获知的工具,提出图片词典应有的标准,希望各路高手能够借鉴打造理想的工9 z: p+ H% z) P8 a6 A3 R, T
具,造福广大词典爱好者。
- ]# R6 ?( H- @7 g8 Z4 `, ]6 U) f' t/ E' p5 j
0 d/ o# G0 P& ~2 i3 f4 p6 {
### 现有图片词典制作技术点评
% @5 U- T$ `6 X2 [2 M- Z N/ q
( O8 N$ ~ [8 V/ x: Z+ S * 图像版mdict字典制作方法 by tsiank
: p0 ?' ~5 t! f, _# J! P# |1 W - src: https://www.pdawiki.com/forum/thread-13451-1-1.html
4 {4 g" q" ?' Q y+ p1 O0 Q - 这是最优秀的原创教程了,入门必修% B1 m {5 V4 X4 p9 t
- 优点:理解图片词典的基本原理
; l; H+ `3 b" d/ k' L( H9 [& K3 A - 问题:导航简陋,难以在页面中定位具体词条
t+ z0 H, W8 f3 M" s8 U3 A * 图片版mdx源文件生成工具 by tsiank! ]9 Y% L& g+ u1 W w
- src: https://www.pdawiki.com/forum/thread-33574-1-1.html1 N* R4 G. L# T9 M* h
- 这是上述教程的升级版,带工具了!+ r; W; w+ l' B3 v7 Z
- 优点:导航体验大大提升;技术门槛极低,小白都可以使用/ g: f; Z: Y9 y0 b: S) g
- 问题1:不能自动处理多部分构成的书籍,目前主要处理正文部分& y3 ^4 H( t: \2 s: `( N* L; ?
- 问题2:生成的mdx源文件有很多细节问题需要进一步处理,如CSS缺文件名、多+ W5 W% b" J* K: H4 O
个标签属性之间缺空格、nobomb格式等
( i: j, g* a) h* Z - 问题3:鉴于使用Excel,无法与其他工具链结合,从修订原始词条文件到生成
& Y& d8 W2 c( U G; C" K5 A mdx源文件无法一步到位+ z8 X3 I4 |' L
- 问题4:导航依然有改进空间,VBA不熟悉,改造困难
; @4 y9 t" ]! ^/ A+ u# f, Z3 x! @ * 以Picture Capture为代表的切图版词典制作软件 by chigre3 等4 `+ s, s2 C# i; k9 ?9 o. a1 T5 _
- src: https://www.pdawiki.com/forum/thread-19040-1-1.html4 R8 O* t; I$ T4 ~+ K' W* p
- 这是对终端词典用户体验最好的工具- g+ }& y5 K8 C
- 优点:直接定位到具体词条、导航丰富+ F9 b* L6 P/ E3 \" `, M! t5 T
- 缺点1:工具非开源、偶尔开放下载、遇到问题没有反馈处理机制3 _: y) _6 J$ B( d8 {, j2 \5 d0 S
- 缺点2:对于普通词典制作者来说极其复杂、体验糟糕
3 U+ e U0 [8 |( P6 N* E * 使用CSS精确定位Visual词典 by 孤影 等
1 F; r8 y7 e1 Q, p; h5 o' a: d - src: https://www.pdawiki.com/forum/thread-20350-1-1.html
. Z1 \) ]. a- W4 j! A - 对于Visual Dictionary词典用户来说,体验很不错7 t8 V( H6 z( n' \. P
- 优点:关键词加亮、可直接在图片上点击关键词链接
. \$ l9 F7 b; w! @9 K6 o - 缺点:具体技术细节不开放,仅可观摩案例Chinese-English Bilingual2 `5 |0 n- h! l: }8 |, ?6 V( P
Visual Dictionary (https://www.pdawiki.com/forum/thread-35929-1-1.html ),
( j5 ]$ N1 [6 Z }- _ 大致是先OCR图片,并通过类似Picture Capture工具切片获取每个关键词的相) Y: t8 }6 f6 d& r# W# c
对定位,最后使用CSS隐藏文字层并定位关键词,太复杂了
8 |( H$ Z$ }7 O3 m4 E7 x/ k# f
" T8 w; q O& p3 B) }### 优秀的图片词典工具链标准
. M+ ~& _* M6 t- u* h
a" O. U2 h+ X& |5 T0 m * 词典成品的导航体验要足够好:核心是有助于快速定位具体词条位置
' B8 Y9 l: H) ^( v9 Y) E. ~ * 词典要能够适应不同尺寸的屏幕:阅读体验好,字体太大或太小都不可取- t S7 G9 \0 i- _% t$ r
* 图片处理要足够简单:使用扫描的整页图片即可,不要切片等复杂操作
3 a# z: u& Y% J1 k" T * 词条的录入、校对要足够简单:要一目了然,不容易出错,技术门槛降至最低
) Y+ M! h: ~7 p9 L0 G) E* @ * 词典修订要快捷:修订原始词头文件后,通过工具可一步到位生成最终的mdx源文件
9 W# I6 o0 ?# w& P9 g( `+ t8 J' x, J- Y p% V- z7 S: E
为了实现上述目标,拟根据自己制作十来个图片词典的实践经验,提出如下制作规范,大
6 Q. d' U9 X& \" L. J& d家可将其看作是开发相应图片制作工具的用户需求文档。- y: Q$ {; k9 D
- y2 b: ~" I, ^( ?2 z( C+ Q## 成品图片词典的导航构想
w; e9 r, J; K, r" n" M8 a
9 ^2 I7 M2 g9 w" p * 在页面顶部显示Pages导航 和 Keywords导航(或有)
$ g d& a7 k; R5 R - Pages:Previous Next Cover Preface Content Index etc.5 s: A+ A& e7 E- R, C
- Keywords:A B C D E F G6 M: S. C/ \/ Y! L# Y4 k# l( v
* 在页面底部显示Pages导航; g# C; m4 \- e: u3 ~) {8 |
- Pages:Previous Next Cover Preface Content Index etc.& z1 j% |7 l$ _. b6 @1 l
* c2 Q6 [5 G2 ?
* 在Pages导航中:. U# a. H* Z: O, J6 [$ d' M. c i: n
- 上下页,可自动处理first和last页面( B) R7 F* n' r5 ^
- 上下页,可自动处理多个部分的页码体系为一个连续整体,如:
7 n9 O$ n L8 R% I3 \ - 正文前123(封面、目录等)、正文123、正文后123(索引、封底等)
4 S+ {" u8 o* u3 Q; Q8 z - 除了上下页外,可自定义添加封面、前言、目录、索引等固定链接。- ^% _$ O+ Y/ Y% Z- h4 x
* 在Keywords导航中:
. j$ s, n( s. N - 若没有关键词,则不显示Keywords导航,适配封面、前言、目录、索引等页面
4 \4 Z6 T- b9 l% r/ ` - 若某个关键词作为mdx的keywords,即使用Keywords导航中的某个关键词进行查% j2 X" p% r# R c) ?
询,则在Keywords导航中加亮该关键词。
/ u% |. c3 _, T5 B) P* P - 若页面作为mdx的keywords,即使用Pages导航中的页码等进行查询,则在
6 r6 G9 C7 V8 p7 G9 V Keywords导航中的关键词不做加亮处理。5 s0 m% X/ ?) l4 I0 u( w; D
$ Q6 w; c: x6 L
## 源文件格式规范. a/ r7 I$ G, n3 q+ Y' X
* b' h7 i: j: @0 l2 ~! r
* 图片文件命名格式:
* ^; ~: v- D4 e - 根据页码编排需要,可将书籍分为多个部分,如:正文前123(封面、目录
/ _, N6 N) g9 t+ X; z 等)、正文 123、正文后123(索引、封底等)( L, e( ^. D3 k( w# E8 L% _
- 对于不同部分的图片,相应文件名命名规范为“前缀名+页码+后缀名”:# p: p- ]9 e& y1 ]) w3 B* M/ Y5 E
- 前导名可自定义,中英文均可,建议采用书籍英文名或拼音缩写等个性化: {' e5 O6 Z% {8 n+ G( g, n {# {" H
名称,避免多词典之间命名冲突
, i+ e* V9 f+ M2 T - 页码位数可自定义,默认4位,可根据需要设为3位或5位等
# Y' v' C$ K3 I7 y3 E8 i. ^/ y - 需要正确识别图片后缀名,如jpg、png等) H/ X0 X/ a% L5 H0 v- F- j. Y* A# ?
- 图片文件名案例:某书前0001.jpg…某书正文0001.jpg…某书后0001.jpg
/ _( X+ u" g$ e) _! L. z2 C' J( h. _7 Z- T
* Keywords源文件格式:- I. x W3 T# J6 ]& q5 ^' C
- 对应书籍的多个部分,将keywords源文件分为多个部分,如:正文前123.txt(封
$ y( d4 f' s8 ?0 M% ^ 面、目录等)、正文123.txt、正文后123.txt(索引、封底等)
2 _: u" c, M7 j$ @8 E4 ] - 具体内容格式(极大化方便用户输入词头、校对和修订):' O, [- v6 z# o7 Y* c
* 第1行页码:0001" B& n0 ?/ G& x' \' Z9 v. o0 _0 V0 B. t
* 第2行关键词:A" f% ^$ h8 ?# |- b) n3 \5 g% J$ y4 X
* 第3行关键词:B
6 N$ I, c5 l: X * 第n行关键词:N
, ]9 U7 ^0 B0 k8 C& r9 D8 X7 E8 @. U * 第n+1行页码:0002
0 B z l9 A5 f1 B0 Y9 Q/ i * 第n+2行关键词:X
$ ]; z6 ~3 p9 u2 \3 K ~ * 第n+3行关键词:Y
+ |1 t! B3 [+ U. j% f- M. O% i, D * 第n+4行关键词:Z
) ?( X/ E7 i4 A% J * ……
, } n0 [* L/ o2 r - 页码之后,可以没有关键词
6 J7 n. C* D2 u. @2 e( T: W - 若有关键词,则同时生成相应的Pages导航和Keywords导航
& v! D) K6 ~0 a - 若没有关键词,则仅生成Pages导航,而没有Keywords导航
~. I. E% S# w: }% k7 q& S2 L0 ?+ j8 k) ], d$ n+ V% P- a/ W8 E' }
## 处理程序及配置文件规范( Q- |0 u2 b8 Z
7 B& M: I2 U# E9 Q * 建议使用Python3,毕竟用户多,大家有能力按需改造
! q& A6 w. _# p; d7 v w% A * 程序作适当配置后,应可一键生成最终的mdx源文件和css" c" |% q6 R% w7 y' E* a
* 主要配置包括:' r$ Q9 }, c% @& w; j$ x1 @ \
- 书籍多个部分对应的Keywords源文件和图片文件 o. p: p$ K+ E0 P6 I1 i0 e; j
- Keywords源文件名称
% G1 i8 K0 k8 a- X; d; _# n8 @7 U - 对应的图片文件名:前缀名 + 页码位数 + 后缀名
0 B9 j# S+ f% h - Pages导航中的自定义固定链接:
6 m& z0 F: J; O+ X( c T+ } - 固定链接名称(如封面目录) + 对应图片文件名
$ E0 J: U) j& a* d: L - mdx目标文件名
- K! v5 P( v6 ?: E5 l5 I# l - CSS文件名( Q3 a- m) E& ?( b- C) t
- 导航的中英文; ]! m, k8 M5 o7 [# E, h$ \& n
- 简中:页面、上一页、下一页、关键词
% u! G8 @1 F3 Z5 s' y* a( U2 z( { - 繁中:頁面、上一頁、下一頁、關鍵詞
' p& K! d5 q; O! u: b5 s - 英文:Pages、Previous、Next、Keywords" N/ Y" S* \7 m& s+ M
' ` i8 }& r. _ Y$ z( z6 a## 目标文件格式规范
8 p& e# U, S0 I7 w4 F* ?' [7 W5 q8 z1 V/ L: ?
* mdx源文件txt需要满足mdx源文件的格式标准:dos,nobomb,UTF-8
- Z! |; E$ e. B$ j1 ? * 生成的CSS可进一步配置:; E# o4 X3 e# b
- Pages导航样式/ F4 X- j6 W4 N6 V. H
- Keywords导航样式7 D j9 k; O4 t+ J! T' N8 U
- 加亮Keyword样式
" x' C0 N/ R1 Y8 e - 图片宽度:百分比(默认100%)或固定大小(px或em)
( U i( M5 `2 q3 t! q2 d) T; S
3 j7 Z3 v4 g; k0 S## 扩展1:整页版和多栏切片版二合一
' E w+ S, r4 p& R' r' ?
: a+ E6 J# M9 ?) ]为适应手机等移动设备的查阅,需要将整页版适度分栏切片
+ l7 B/ _) k. a6 v0 R I* ^! R& z- T V
* 词条需要分栏处理1 o1 s7 G; s, x0 Z
* 图片文件名需要分栏处理
" M# ~- k2 ~- J5 k * CSS要能够自适应不同屏幕尺寸的设备$ p {1 U0 E7 i% h$ B
5 e$ x$ H k! g y' u7 D+ E' P
具体改造略) q+ O! N; S* ~2 I
* j4 j2 @: k4 z) H
( a0 P0 G; [, u$ F
## 扩展2:多层次词头优化
6 v+ A" H5 k" }' @) Z( i6 n/ B' {. o5 D# s6 n, l# X4 O
为优化类似Longman Language Activator、朗文多功能分类词典、现代汉语词典等词头有 G! Z5 T5 h# T
多个层次的词典,可在原有标准基础上,进一步将Keywords区分为多个层次,如字、词:
6 a; _; `* M. \$ N( o. P
+ M4 q1 i9 W' ?8 ~% X' @" X) h * 在页面顶部显示Pages导航 和 字词导航(或有)
, o$ M; ]! D7 y% X% A$ n% ^ - 页面:Previous Next Cover Preface Content Index etc.% g% A$ {) m3 V' x* r: s7 ]1 I
- 字:A B C D E F G
5 U! Z* O9 y {8 k1 V - 词: WordA1 WordA2 WordA3 WordA4
6 }. W, j: u5 o- i" N& z" w * 在页面底部显示Pages导航
/ x1 ^6 I6 g1 w, w; Y3 y) w( O - 页面:Previous Next Cover Preface Content Index etc.
, @: z) y. g, t$ k. }. D' ]9 ~. o
* 当查询页码(并未查询具体的字或词)时,仅显示页列表
4 h6 J2 t9 K; g$ k * 当查询某个字或某个词时,不仅显示字列表,还显示这个字所包含的词列表
0 k0 T7 e9 e, F1 c- Z6 L
+ ~) p7 M4 }$ E% A# F- h4 [具体改造略/ o+ z3 y9 F4 ?- C! W% G2 k. ^
! h+ D j* T( t## 诚邀Python等高人打造开源的图片词典制作工具; r4 [* B( M$ a( p
) B* |" ~( _7 i* |% a9 X2 w
若能够制作符合上述标准的工具(先有标准版的即可,扩展版再逐步优化),必将造福广
: {; [9 g% r) [; j8 W8 x* W' T% e大词典爱好者,无论是字典制作者,还是字典使用者。
1 A2 R' B) r$ G4 g, r9 p& e; h$ q5 E' r4 I, r# D
若有需要,我可提供相关案例词典:包括完整的图片、词条等。6 }$ l5 n; K1 W5 Q0 n3 o' E2 }
' e" o- }- a8 j |
|