掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 6170|回复: 49

[词典校勘] W.B.D.2011完美版精校人员征集

 关闭 [复制链接]

该用户从未签到

发表于 2014-8-21 19:43:15 | 显示全部楼层 |阅读模式
本帖最后由 bt4baidu 于 2014-8-30 13:47 编辑 # A9 z8 z  P  q) n7 k. _
# g5 J  q2 C$ }* F+ `! K
蓝本为参与某词典文本化时从O大处获得的最新world book dictionary2011版。非常好用的一本词典!0 U1 |& J+ ?$ a; D
收词量大,解释简洁易懂,不罗嗦;难易度介于学习型词典和大学词典之间,适合作为学习型词典向大学词典进阶的过渡。
5 H6 k' a7 Z- @4 x7 F: N6 e
关于该词典的好处,详细说明见O大的帖子:. H' C* s; \0 w$ l0 C" [
https://pdawiki.com/forum/forum. ... &fromuid=1769179 P% n6 o) f7 L& L7 R

  Y/ R3 |1 f. ~因其数据、排版瑕疵较多,不易阅读,故将其精排。
8 ~* c) s; P. I5 ](已修复的瑕疵和无法解决的问题见:https://pdawiki.com/forum/thread-11446-1-1.html: k* G0 m: t; b4 d6 g
  O6 [5 {: ^( h# l  w5 `) W
经过本人用程序格式化,目测排版完成度在95%左右,剩下的瑕疵过于琐碎,已无法用程序批量处理。1 U' T! y1 d# \6 g% K: ^
因此欲招募10~20人左右人工挑错、精排,做出完美版{:10_301:} 。
( L# S# w9 ]$ U# ]* Z# X  _
( M1 d; J% Y4 Y6 L% Z2 a4 j几点说明:. u- U) g+ e% M/ ?
1、参与人员限手里已经有WBD2011的同学。因为该词典原系O大制作,本人无权共享词典数据。0 A/ m& S) X7 e/ I
手里没有该词典,但希望参与者请和O大商量(交换、参与文本化等等,O大显然是不会白给的{:10_268:} )。* C0 k0 k+ g8 ^( {$ ^
2、报名方法:请给本人私信,并附WBD2011的任意词条查询结果拷屏,否则视为无效申请。
% ?! J3 F% T0 y2 I3、报名满10人即开工分配任务,满20人停止招募;多出的人员作为候补。
7 |# t9 f) [. Z9 i% ^若本周末报名参与人数不满10人,则已报名者先开工(分配不超过8%的任务);! n+ A* G. v, K* F1 \
校完不超过8%的文本后,即可获得当前最新校对版成品,及最终版成品。
% c& B& x% H  x1 I7 G3 C
4、有三个单词un、non、pre-里有大篇的单词表,浏览甚为不便,且意义不大,因此删掉了。' `$ I/ U/ c1 p( b; M
5、作业方式及要求:
4 q; j$ _0 l( v: U) q* p
主要就是使用chrome、IE等浏览文本;或者编译成mdx,用mdict逐词条浏览;没有技术含量,但要求眼尖心细
, X. k& S' n: ?" a# ^发现可疑处,对照WBD2011原版及WBD旧版(宇宙盘里有)确认;- g1 R) B2 X: ?  |0 H/ \
找到排版错误或数据错误后,如果是比较有规律的错误,最好回复此贴通知本人修改,如果是个别现象,可顺手修改,也可以通知本人修改(指出某词条第X义项)。
( r, B: {; @- J* ^: O) x* K就是说,允许只挑错、不修改。实为茶余饭后的好消遣!
3 P- _/ d7 Z0 V# H4 S, X8 W注意:千万不要改变编码(UTF8无BOM)、不要增加换行(请使用文本编辑器的软换行功能),2 s5 A2 u7 l) Y$ F7 Q. M
同时不要按个人喜好改变样式(已经CSS外置化,拿到最终成品后自己想怎么改都行),否则各部分无法整合。

1 b' S9 D: Q# [+ S# N* y; S6、时间要求:因为工作量不大,打算一周到半个月内结束;即所有人员一周至少要校完50%,反馈一次(给本人私信);
3 s. u1 T) \" S& `. L2 m2 l1 s4 X2 K拖延无反馈视为主动退出,将不会得到最终成品。请量力而为、考虑自己时间是否许可,再决定要不要参与。9 u. x; D8 ~9 f' \% [

0 p$ @& ^. R. m排版后的显示效果见附件
" x7 r5 V+ U) X# v: E, u! ^4 o
( B& s! Q& J& [& F
/ l, U9 A! |4 _9 o" c样式具体说明见图:
* U( D) y5 k; F; O5 y0 i8 p+ w5 m: v3 {6 _

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2014-9-12 17:56:43 | 显示全部楼层
本帖最后由 mitkyg 于 2014-9-12 17:59 编辑
; ~% l% V  @" B, g$ C5 P7 m/ A
bt4baidu 发表于 2014-8-29 00:04/ }" j4 }/ t& B
第一轮校对顺利结束了!
4 t7 J$ V" t4 S9 j- r
7 d; u0 n5 D1 y* i5 K& ~9 K请各位参与的同学下载最新版,链接没变,不一一通知了。忘了链接的发 ...
3 z: I3 M1 }; F8 D$ {" j! |

1 R: N4 f$ B9 M) E" k/ obt兄......world book dictionary 地址链接不存在了...论坛消息也没用..... Y' Y. i5 i- U" T' P; z: N
盼再分享下 , 地址发邮件吧 jidakanyuguang#163.com 感谢

点评

论坛消息已恢复正常。  发表于 2014-9-12 19:46

该用户从未签到

发表于 2016-6-6 23:46:11 | 显示全部楼层
bt4baidu 发表于 2014-8-24 22:02
8 H" n) J2 A+ ?/ u8 ?所以说用户群就是个伪命题,大部分都是围观的看客,只有极少数才是真正产生利润的
+ z$ Q( p/ Q4 `7 Z: f1w人的用户群和100 ...
, z, T' e% Z* Q& {, x# I, I
完全赞同。精英永远是少数。

该用户从未签到

 楼主| 发表于 2014-8-21 22:24:26 | 显示全部楼层
参考数据:+ i1 b; Z; _% G' q5 U, I) Z$ l
词条数:1339049 h" G' f$ o: I. K: e
HTML文本:80.4Mb

7 p# H; f# \+ y! F- {) z
3 X0 K. l# Z) j9 `- Y+ R每人只需校对6~8Mb,即可获得全部文本!
+ g- T: @% g$ ^2 _5 N/ U$ ]
+ K9 I) m7 ~: H: [* j

该用户从未签到

发表于 2014-8-21 22:38:23 | 显示全部楼层
= =想试试,奈何时间不允许。

该用户从未签到

发表于 2014-8-22 05:31:55 | 显示全部楼层
本帖最后由 Oeasy 于 2014-8-22 05:35 编辑 ! ~, g: p' m7 F# H- {( ^3 N

3 |8 h, J. |) F2 w% k5 E
3 T' g2 D6 @  _. h& N
& v, R; k8 H! Q. C1 r, Yperfectionist 和 aesthete 才会参加。 7 v5 J; A0 M# n4 D9 w8 [5 q
其实,全地球上,我知道的有那个WBD 版本的mdx/mdd的,不超过32人,从中要募集10~20人,这难度很高。不过就算发布出来,所有人都可以下,还是招不到几个人的,然后可能还是单兵作战,再然后可能就不了了之了:这是文本化、合作、分享的一点切身体会。
9 n& |- \& n' R! j* C
$ F6 c3 f+ T( L' e3 R: u+ R{:5_227:} 0 k% L/ \9 V5 f  e7 M: T3 s
7 [- F+ m) m( t9 X8 U& U0 X/ N+ n+ i
   
% k/ _9 E, L# S- i0 q& T

该用户从未签到

 楼主| 发表于 2014-8-22 09:52:10 | 显示全部楼层
Oeasy 发表于 2014-8-22 05:31
' U9 J4 S$ r  S8 c# X& j8 Bperfectionist 和 aesthete 才会参加。
3 `; S" s3 _5 X4 s& @3 J其实,全地球上,我知道的有那个WBD 版本的mdx/mdd ...
" P. j; U) q8 Z) W. V7 L  S
O大你有兴趣吗?作为WBD的粉丝{:5_227:}
/ @( q8 K) S# G3 ~
4 A1 z7 R$ v+ X$ e9 M  t9 b分你一半如何?
* t5 ?9 [, \, ]9 _===
; ?6 l3 x7 M! g, g" Q1 [目前完成度已经超过95%了,数据都在,只是由于网站瑕疵的影响,有些词条没有完全排版正确
7 ~: T  v8 [8 e没有特别影响使用的问题;如果不是完美主义思想作崇,直接就可以用的9 P9 W7 g! u# Q' D) W
所以没有不了了之的问题7 g2 X4 s6 ?+ w' u, {8 c

该用户从未签到

发表于 2014-8-22 10:18:31 | 显示全部楼层
本帖最后由 meigen 于 2014-8-22 10:20 编辑
3 P' N" x( i0 O. g
5 {& ~6 q0 Z4 A# l3 o) r7 h/ w难得又见到一个非O版发的校对帖/文本帖

点评

欢迎参与  发表于 2014-8-22 22:13

该用户从未签到

发表于 2014-8-22 11:41:57 | 显示全部楼层
本帖最后由 mitkyg 于 2014-8-22 11:52 编辑 $ V& e, Q9 h/ y7 R: b4 W
2 A6 ]4 \  o6 a/ u1 j9 j) T
我先报个名{:5_222:} 非常喜欢wbd(王八蛋){:5_186:}9 j0 S3 z, \# U( D

该用户从未签到

 楼主| 发表于 2014-8-22 11:54:56 | 显示全部楼层
{:5_227:}
  ~$ f6 a; M/ M6 r( x8 Q9 R7 N2 Z- _: S! t- A
我自己看了差不多1000个词,大概也就不到10个词有些小问题0 L& D; b) F9 m3 d
发现对瑕疵有些高估。。。完成度应该在99%以上

该用户从未签到

 楼主| 发表于 2014-8-22 12:42:57 | 显示全部楼层
说英汉大词典以WBD为蓝本也不为过啊,排版、词条数据组织形式太相像了,有些单词甚至连义项的条数和顺序都没变
# S) h# M: e: ?- k3 Q  v. i& hWBD收了大量自然科学方面的单词,数学、物理、化学、地理。。。连分子式、化学方程式和代数等式都列出来了8 G3 @$ _. k+ t
英汉大也部分继承了这一特点

该用户从未签到

 楼主| 发表于 2014-8-22 20:31:33 | 显示全部楼层
本帖最后由 bt4baidu 于 2014-8-22 20:35 编辑
: Y+ @4 [- i7 m8 o6 O  [. |! R3 Y  p- V# p  H- M. y# |" q, S
已报名的同学可以开工了!请看私信{:10_301:}- d5 x9 z1 x6 \7 b9 g
7 v/ g' u1 @. x) B& f. ?
注意事项:5 L$ c) q( y! {3 E. c
1、如果用chrome等浏览,请先把扩展名改为.htm;然后把每个词条的<link href="wbd.css" rel="stylesheet" type="text/css"/>删掉,只需保留一个即可;否则会死机的。
4 O( E1 M- C2 ^0 ~+ [2、修改词条请先把该词条单独拷到一个文件里,再修改,方便检查,也方便后期整合及二校;最后只用给我这个文件即可。
0 w; W2 x9 R6 I$ G; o& @% j. c3、遇到不确定的问题请回帖讨论,否则万一理解有误改错了,就变成无用功7 V9 H) [# X9 l7 n$ D8 Q1 y! ]* r+ D# `

; {1 g- L* R. S5 N5 `/ H5 S8 G: M
根据本人实测,大约每小时可以检查1500个左右单词。
4 r- G4 S6 j! l1 K2 m& S7 z* m

该用户从未签到

 楼主| 发表于 2014-8-22 21:47:05 | 显示全部楼层
本帖最后由 bt4baidu 于 2014-8-23 10:24 编辑
6 j' K; t7 ~* [$ H/ d  a8 w3 g& L; s; j
容易出问题的几个地方:
- _7 Q, j& [4 e0 ^* L2 Z字体:正体/斜体,本人原则是尽量不用斜体;如果出现大段的斜体很可能就是有问题了
" h. _- p) E5 L, `$ u颜色:参见贴图,词性大分类可能有未设成金色背景的、学科/行业可能有未转换成蓝绿色的、例证出处没有显示为灰色、非例证出处却显示为灰色的;  o; b' {3 |) C9 l4 A* \2 L' A1 }

& ?4 m0 m4 `( p' Z! d% M# ~0 ]不必对琐碎的地方抠得过细,大原则是不能出现影响阅读的情况,不能出现误导读者的情况(比如明明是词性却设成了学科的颜色就是误导),以及排版明显和别的词条不协调的情况6 i* G% G1 A. H$ Z+ Y6 ]

: S) y6 b( b, [6 S乱码的问题我已经解决过了,这方面的问题不用考虑* \2 q$ y) S0 v8 a. L( \
主要是排版和数据的整体协调一致性,以上述三大原则为准,不用抠太细: N+ _- r5 J0 j& K+ {2 _1 M

/ [# Z0 O' i7 |1 P如果发现大篇的排版格式问题,最好通知本人来改,本人可以写程序专门处理
3 N0 o6 M& d/ _+ N. r人工修改费时费力且容易出错。

该用户从未签到

 楼主| 发表于 2014-8-22 22:30:30 | 显示全部楼层
继续接受报名

该用户从未签到

 楼主| 发表于 2014-8-23 10:26:52 | 显示全部楼层
顶一下{:11_351:}

该用户从未签到

发表于 2014-8-23 12:10:20 | 显示全部楼层
bt4baidu 发表于 2014-8-22 22:30 % ~/ {4 L4 I! k; y+ ^# K9 j, V
继续接受报名

- K% J% m, e) d) t! r5 U4 Ho 说了,这世界上最多有32个人有这个mdx,所以人估计不多,参与人尽量多干一些吧。

该用户从未签到

发表于 2014-8-23 12:20:25 | 显示全部楼层
26号占个坑.......

该用户从未签到

 楼主| 发表于 2014-8-24 00:30:32 | 显示全部楼层
本帖最后由 bt4baidu 于 2014-8-30 13:48 编辑
2 p" V$ w8 q  ~7 A, [1 s( x6 p" ^6 ]4 c" p) Q7 Q- V* _
{:10_293:}

该用户从未签到

 楼主| 发表于 2014-8-24 15:43:42 | 显示全部楼层
已经校完1/3强了{:10_301:}

该用户从未签到

 楼主| 发表于 2014-8-24 21:55:33 | 显示全部楼层
报名人数少于预期,进度超过预期6 `* }+ P2 b- f( b( h
看来真是人贵在精,不在多。
, ^6 @0 k( {( h  r继续接受报名,不需要会HTML/CSS,只要挑错即可,由我来改

该用户从未签到

发表于 2014-8-24 21:58:57 | 显示全部楼层
bt4baidu 发表于 2014-8-24 21:55
; ~9 }! q# X9 S$ e1 w, }报名人数少于预期,进度超过预期
( T7 J' v* f6 p- ^- ^3 H) W+ y" O看来真是人贵在精,不在多。* J, P; X' \- X8 E5 C
继续接受报名,不需要会HTML/CSS, ...

/ j/ A! y9 j6 I0 M. V" K * d) h+ ^6 {+ c! {& H
3 u/ [7 K6 y0 z/ U# N* h
有这个东西的都是好同志,战斗力强,说干就干,不会拖延、失联、放人鸽子……
8 b* q$ p% e. ]2 a5 ^! }* X) ^- C. ^. x

该用户从未签到

 楼主| 发表于 2014-8-24 22:02:34 | 显示全部楼层
本帖最后由 bt4baidu 于 2014-8-24 22:04 编辑
) k! e8 |" U/ n6 a
Oeasy 发表于 2014-8-24 21:58 ! S+ C: F5 l! d. y* P8 K1 R
有这个东西的都是好同志,战斗力强,说干就干,不会拖延、失联、放人鸽子……
, ~/ U) C' i- @7 h& |; ]3 `
1 t; l2 w* L) {* w3 G
所以说用户群就是个伪命题,大部分都是围观的看客,只有极少数才是真正产生利润的
: m: F! K6 z+ ^  n" c4 D) |1w人的用户群和100人的用户群并不见得有根本的差别,很可能只有其中的几十人是带来价值的

该用户从未签到

发表于 2014-8-25 14:49:34 | 显示全部楼层
本帖最后由 houbible 于 2014-8-25 21:56 编辑 + h! V# D) g; I3 T

# g4 S+ S& d0 Z  ]3 F我也来报个名吧,刚刚得到这个词典。晕哦,上传不了图片。晚上回家试试。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

 楼主| 发表于 2014-8-25 21:54:52 | 显示全部楼层
houbible 发表于 2014-8-25 14:49 2 v( a) u; P+ i; U( H9 @! u3 w
我也来报个名吧,刚刚得到这个词典。晕哦,上传不了图片。晚上回家试试。

1 Y5 t* |6 p# D: x欢迎,已经给你预备了一份

该用户从未签到

发表于 2014-8-25 22:22:39 | 显示全部楼层
把分配的文本制成mdx,用mdict一条一条浏览,速度还是很快的,剩下的错误应该很少了....很快就会校对完了

该用户从未签到

发表于 2014-8-25 22:40:00 | 显示全部楼层
约4个多小时能校对完一份吧---6m大小

该用户从未签到

 楼主| 发表于 2014-8-25 23:29:38 | 显示全部楼层
mitkyg 发表于 2014-8-25 22:22 , o1 G; W3 N3 {  B
把分配的文本制成mdx,用mdict一条一条浏览,速度还是很快的,剩下的错误应该很少了....很快就会校对完了{:4_1 ...

2 f$ X3 a1 l% |" f& K: }3 Q/ n我都是正则查找改的,越往后错越少了
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2024-5-15 10:49 , Processed in 0.111642 second(s), 12 queries , MemCache On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表