W.B.D.2011完美版精校人员征集
本帖最后由 bt4baidu 于 2014-8-30 13:47 编辑蓝本为参与某词典文本化时从O大处获得的最新world book dictionary2011版。非常好用的一本词典!
收词量大,解释简洁易懂,不罗嗦;难易度介于学习型词典和大学词典之间,适合作为学习型词典向大学词典进阶的过渡。
关于该词典的好处,详细说明见O大的帖子:
https://pdawiki.com/forum/forum.php?mod=redirect&goto=findpost&ptid=12917&pid=178442&fromuid=176917
因其数据、排版瑕疵较多,不易阅读,故将其精排。
(已修复的瑕疵和无法解决的问题见:https://pdawiki.com/forum/thread-11446-1-1.html)
经过本人用程序格式化,目测排版完成度在95%左右,剩下的瑕疵过于琐碎,已无法用程序批量处理。
因此欲招募10~20人左右人工挑错、精排,做出完美版{:10_301:} 。
几点说明:
1、参与人员限手里已经有WBD2011的同学。因为该词典原系O大制作,本人无权共享词典数据。
手里没有该词典,但希望参与者请和O大商量(交换、参与文本化等等,O大显然是不会白给的{:10_268:} )。
2、报名方法:请给本人私信,并附WBD2011的任意词条查询结果拷屏,否则视为无效申请。
3、报名满10人即开工分配任务,满20人停止招募;多出的人员作为候补。
若本周末报名参与人数不满10人,则已报名者先开工(分配不超过8%的任务);
校完不超过8%的文本后,即可获得当前最新校对版成品,及最终版成品。
4、有三个单词un、non、pre-里有大篇的单词表,浏览甚为不便,且意义不大,因此删掉了。
5、作业方式及要求:
主要就是使用chrome、IE等浏览文本;或者编译成mdx,用mdict逐词条浏览;没有技术含量,但要求眼尖心细
发现可疑处,对照WBD2011原版及WBD旧版(宇宙盘里有)确认;
找到排版错误或数据错误后,如果是比较有规律的错误,最好回复此贴通知本人修改,如果是个别现象,可顺手修改,也可以通知本人修改(指出某词条第X义项)。
就是说,允许只挑错、不修改。实为茶余饭后的好消遣!
注意:千万不要改变编码(UTF8无BOM)、不要增加换行(请使用文本编辑器的软换行功能),
同时不要按个人喜好改变样式(已经CSS外置化,拿到最终成品后自己想怎么改都行),否则各部分无法整合。
6、时间要求:因为工作量不大,打算一周到半个月内结束;即所有人员一周至少要校完50%,反馈一次(给本人私信);
拖延无反馈视为主动退出,将不会得到最终成品。请量力而为、考虑自己时间是否许可,再决定要不要参与。
排版后的显示效果见附件
样式具体说明见图:
https://pdawiki.com/forum/data/attachment/forum/201408/21/183846n34rcjjtvytw24v3.png
本帖最后由 mitkyg 于 2014-9-12 17:59 编辑
bt4baidu 发表于 2014-8-29 00:04
第一轮校对顺利结束了!
请各位参与的同学下载最新版,链接没变,不一一通知了。忘了链接的发 ...
bt兄......world book dictionary 地址链接不存在了...论坛消息也没用....
盼再分享下{:4_104:} , 地址发邮件吧 jidakanyuguang#163.com 感谢{:4_104:} bt4baidu 发表于 2014-8-24 22:02
所以说用户群就是个伪命题,大部分都是围观的看客,只有极少数才是真正产生利润的
1w人的用户群和100 ...
完全赞同。精英永远是少数。 参考数据:
词条数:133904
HTML文本:80.4Mb
每人只需校对6~8Mb,即可获得全部文本!
= =想试试,奈何时间不允许。 本帖最后由 Oeasy 于 2014-8-22 05:35 编辑
{:4_109:}
perfectionist 和 aesthete 才会参加。
其实,全地球上,我知道的有那个WBD 版本的mdx/mdd的,不超过32人,从中要募集10~20人,这难度很高。不过就算发布出来,所有人都可以下,还是招不到几个人的,然后可能还是单兵作战,再然后可能就不了了之了:这是文本化、合作、分享的一点切身体会。
{:5_227:}
Oeasy 发表于 2014-8-22 05:31 static/image/common/back.gif
perfectionist 和 aesthete 才会参加。
其实,全地球上,我知道的有那个WBD 版本的mdx/mdd ...
O大你有兴趣吗?作为WBD的粉丝{:5_227:}
分你一半如何?
===
目前完成度已经超过95%了,数据都在,只是由于网站瑕疵的影响,有些词条没有完全排版正确
没有特别影响使用的问题;如果不是完美主义思想作崇,直接就可以用的
所以没有不了了之的问题
本帖最后由 meigen 于 2014-8-22 10:20 编辑
难得又见到一个非O版发的校对帖/文本帖http://static.tieba.baidu.com/tb/editor/images/client/image_emoticon16.png 本帖最后由 mitkyg 于 2014-8-22 11:52 编辑
我先报个名{:5_222:} 非常喜欢wbd(王八蛋){:5_186:}
https://pdawiki.com/forum/data/attachment/album/201408/22/114943urv77ho7g6ry8yyr.png {:5_227:}
我自己看了差不多1000个词,大概也就不到10个词有些小问题
发现对瑕疵有些高估。。。完成度应该在99%以上 说英汉大词典以WBD为蓝本也不为过啊,排版、词条数据组织形式太相像了,有些单词甚至连义项的条数和顺序都没变
WBD收了大量自然科学方面的单词,数学、物理、化学、地理。。。连分子式、化学方程式和代数等式都列出来了
英汉大也部分继承了这一特点 本帖最后由 bt4baidu 于 2014-8-22 20:35 编辑
已报名的同学可以开工了!请看私信{:10_301:}
注意事项:
1、如果用chrome等浏览,请先把扩展名改为.htm;然后把每个词条的<link href="wbd.css" rel="stylesheet" type="text/css"/>删掉,只需保留一个即可;否则会死机的。
2、修改词条请先把该词条单独拷到一个文件里,再修改,方便检查,也方便后期整合及二校;最后只用给我这个文件即可。
3、遇到不确定的问题请回帖讨论,否则万一理解有误改错了,就变成无用功
根据本人实测,大约每小时可以检查1500个左右单词。
本帖最后由 bt4baidu 于 2014-8-23 10:24 编辑
容易出问题的几个地方:
字体:正体/斜体,本人原则是尽量不用斜体;如果出现大段的斜体很可能就是有问题了
颜色:参见贴图,词性大分类可能有未设成金色背景的、学科/行业可能有未转换成蓝绿色的、例证出处没有显示为灰色、非例证出处却显示为灰色的;
不必对琐碎的地方抠得过细,大原则是不能出现影响阅读的情况,不能出现误导读者的情况(比如明明是词性却设成了学科的颜色就是误导),以及排版明显和别的词条不协调的情况
乱码的问题我已经解决过了,这方面的问题不用考虑
主要是排版和数据的整体协调一致性,以上述三大原则为准,不用抠太细
如果发现大篇的排版格式问题,最好通知本人来改,本人可以写程序专门处理
人工修改费时费力且容易出错。 继续接受报名 顶一下{:11_351:} bt4baidu 发表于 2014-8-22 22:30 static/image/common/back.gif
继续接受报名
o 说了,这世界上最多有32个人有这个mdx,所以人估计不多,参与人尽量多干一些吧。 26号占个坑....... 本帖最后由 bt4baidu 于 2014-8-30 13:48 编辑
{:10_293:} 已经校完1/3强了{:10_301:} 报名人数少于预期,进度超过预期{:4_104:}
看来真是人贵在精,不在多。
继续接受报名,不需要会HTML/CSS,只要挑错即可,由我来改 bt4baidu 发表于 2014-8-24 21:55 static/image/common/back.gif
报名人数少于预期,进度超过预期
看来真是人贵在精,不在多。
继续接受报名,不需要会HTML/CSS, ...
{:4_93:}
有这个东西的都是好同志,战斗力强,说干就干,不会拖延、失联、放人鸽子……
本帖最后由 bt4baidu 于 2014-8-24 22:04 编辑
Oeasy 发表于 2014-8-24 21:58 static/image/common/back.gif
有这个东西的都是好同志,战斗力强,说干就干,不会拖延、失联、放人鸽子……
所以说用户群就是个伪命题,大部分都是围观的看客,只有极少数才是真正产生利润的
1w人的用户群和100人的用户群并不见得有根本的差别,很可能只有其中的几十人是带来价值的 本帖最后由 houbible 于 2014-8-25 21:56 编辑
我也来报个名吧,刚刚得到这个词典。晕哦,上传不了图片。晚上回家试试。 houbible 发表于 2014-8-25 14:49 static/image/common/back.gif
我也来报个名吧,刚刚得到这个词典。晕哦,上传不了图片。晚上回家试试。
欢迎,已经给你预备了一份{:4_104:} 把分配的文本制成mdx,用mdict一条一条浏览,速度还是很快的,剩下的错误应该很少了....很快就会校对完了{:4_105:} {:4_105:}约4个多小时能校对完一份吧---6m大小 mitkyg 发表于 2014-8-25 22:22 static/image/common/back.gif
把分配的文本制成mdx,用mdict一条一条浏览,速度还是很快的,剩下的错误应该很少了....很快就会校对完了{:4_1 ...
我都是正则查找改的,越往后错越少了
页:
[1]
2