掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 758|回复: 0

[词典讨论] 词典从数据到纸版再到 app 的工艺流程[猜测][...]

[复制链接]

该用户从未签到

发表于 2017-9-8 12:35:19 | 显示全部楼层 |阅读模式
本帖最后由 Oeasy 于 2017-9-8 12:41 编辑 3 {) Y+ ~0 a2 m8 r' q+ ^6 w

" R( D1 y! A1 j' @9 m
0 B6 v  f+ m+ c! |! l" x隔行如隔山啊,以下都是我的猜测,其实也真的很希望有业内人士能科普科普。
/ e! J5 l5 a' l' s, j' v9 o; V
8 o5 C8 C9 Z! p. ~' u$ U4 U' l词典从数据到纸版再到 app 的工艺流程[猜测][...]
+ R% e0 k7 Z9 \8 T
9 N+ ]4 s! w4 H0 a& Lhttps://pdawiki.com/forum/forum. ... &fromuid=147948% |+ u8 F1 t; F- i% l. O" L# [# [+ p- U
, b5 M* j) [1 @2 E
词典从数据到印刷,中间流程我估计应该如下:
# c6 S% e* T" E/ r8 Z( f9 W, @3 `; Y1 n- ~
词典编纂系统 XML 数据(数据①) -> Adobe InDesign 之类的排版系统排版加上页码、封面、辅文等等 (文件②)-> 打印出纸版继续校对,如果有错那就直接在排版软件、文件里面改,但是估计没有去改原始的 XML 数据 -> 打印样书,可能还要校对 -> 差不多了,排版完工,得到印前文件③印刷开卖……
. S$ i  E/ ~* i0 V: x! h6 `: \) r. g* v* b; ?/ A1 w. I
校对改的是“文件②”,印刷用的“文件③”,但是拿去做 app 的却是“数据①”,二者内容有一些细微差别的。
+ p# E, _5 [' O( U% u
& }8 x% G2 B2 d! F$ K" H“文件②/③”是有页码、封面、辅文等各种纸版特色信息的,是无法直接拿来做查询类的 app 的。 ; h9 R. p8 W9 }: X' W# l' }
/ V' U4 G$ p; V/ }2 j. B3 [. e
朗文双解 DVD 图片版应是用“文件③”转制的,但是 app 以及授权给有道、卡西欧的,却是“数据①”。
0 V) R8 b9 a# a( N: D' w  U, [1 ?  F' }) k
注:这里的词典指的是主流的较为现代化的词典。其实“古代”或者比较“落后”的词典,一个 word 文件就搞定了,不存在“数据①”。
( r! o; n) o( Q+ V- _, u
0 v3 b& W7 C! x只要是电脑排版的词典,都是有“文件②和文件③”的,从“文件③”到结构化良好的、可查询的数据①,中间还有很长的路。当然,现在主流的词典,都是先有“数据①”,再转“文件②->③”,省了流程,但是,文件③的一些改动,可能就没有体现到“数据①”里,导致用“数据①”做的 app,内容和纸版有不一致的地方。. E9 i; m3 l) E) U4 r

4 A% l! J6 _7 e0 C5 _  i" U0 T$ U' L' M1 d% ]; O6 w4 k
---
0 n( E0 }. U9 V! f- [英-汉] zt//用方正书版排《新时代英汉大词典》 https://pdawiki.com/forum/thread-12852-1-1.html  i" M! ?* x5 y
- [英-汉] 【旧】辞海悦读器内置《英汉大词典》(第2版)&《辞海》(第六版)? https://pdawiki.com/forum/thread-12773-1-1.html
' T4 _# P" n. b4 L
二、开展《英汉大词典》(第二版)数字化基础工作
! i; t" [& W; ~3 w) `% f  《英汉大词典》是编纂处最重要的词典产品。编纂处把对《英汉大词典》(第二版)的数据库建设和数据维护当作是一项日常工作加以落实。) D$ _" f! R2 ?3 C3 C
  《英汉大词典》主编陆谷孙教授在《英汉大词典》(第二版)的序言里说,“垒土不辍,丘山崇成。” 《英汉大词典》(第二版)从2007年出版以来已重印9次,一直在实践这一句“垒土不辍,丘山崇成”。编纂处在译文论坛上开辟了专门讨论《英汉大词典》的板块,广泛征求读者意见,收集读者有价值的反馈和建议;建立后台发布系统,把经主编确认的“硬伤”在译文网站进行在线发布;坚持在每次重印前必将已知“硬伤”挖改一部分,并为发现的各种“软硬伤”建档案,便于在《英汉大词典》(第三版)中使用。
; n/ p$ j; w& Q& }- d' x# _5 U4 D  在校正词典内容的同时,编纂处对《英汉大词典》(第二版)的数据结构作了深入研究,积极探讨将方正排版数据转化为xml数据的可能性。2010年,集团为配合《辞海》悦读器开发,要求编纂处把《英汉大词典》(第二版)整理XML结构文档。由于有了前期的准备和对转档从宏观结构到微观处置的预先考虑,在短短两个月里,编纂处完成了《英汉大词典》(第二版)排版文件的转档工作,并做到了对《英汉大词典》所有有效字段的全标引。《英汉大词典》(第二版)全书1700万字,转档后的XML文档以A3横向6栏布局双面打印,共计纸样1万余张。编纂处参加数据转档工作的主要人员在两个月里,坚持做到工作日每天加班2.5小时、周末加班一天。一方面,组织力量对ECD转档文件的全文作了结构和内容两个层面的检查和通读;另一方面,采取一个编辑跟进一个打字员的方式,全程参与易文网的改样,以确保改样与复红一次完成,从而加快进度,并保证质量。
" I) N- F7 C! D& i
. t' ^! q$ [# y2 W  W$ I. O9 V
1 Y2 D" s- u) U% \' C+ K
- [索引] 词典成本[...]  https://pdawiki.com/forum/thread-17114-1-1.html
9 r- A; _( f1 P1 t& u- [德语] 世界上最大的德语词典格林词典在中国完成电子化 https://pdawiki.com/forum/thread-13474-1-1.html: F: P. w: p$ `4 J2 f6 u

( K) @) L1 n; J% j$ ~! D; i4 ]( T( V5 j
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2025-5-12 15:18 , Processed in 0.020050 second(s), 21 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表