英汉大词典2文字校对,老神仙的粉丝们快进来报名,组织考验你们的时候到了!
本帖最后由 大熊部落 于 2016-12-19 15:23 编辑计划是做出一个适合全文检索的《英汉大词典》第2版。
每人55页纯文本,参照 meigen的图片版 进行校对,请跟帖报名!
校对已开始,还需要18个人……{:11_395:}
为什么改为55页?因为印刷版正文共2384页,如果每人50页的话,就要48人,太不吉利。{:4_101:}
请以认真负责的态度进行校对。
尽量在明年3月之前完成。
(本人认为最漂亮的文本是纯文本,所以不会对本词典添加任何在微软notepad中无法显示的信息。)
****************************
每人可在最终文本中埋入 彩蛋 一个!{:12_439:}
目的有两个:
1、为枯燥的校对工作增添一分情趣;
2、监督其它网站对本词典的使用。
请以 ★这是彩蛋:xxxxxxxxxx(不超过20字节)★ 的形式添加文本,以免我二校时误杀。
彩蛋将完美隐藏于最终文本,既不易被发现,也不影响词典查阅。
****************************
文本编码为utf-8。
推荐 EmEditor 作编辑软件,可在“工具” - “当前配置属性”中设置高亮以`开头的行。
以下是部分校对规则(完整版见群文件中的“示例文本”):
※ 尽量参照源文本格式。
※ 词条顺序与印刷版保持一致。
※ 词头前务必添加 ` 这个符号。
※ 英文例句与中文翻译之间以 / 隔开。
※ 英文短语与中文翻译之间以 \ 或 / 隔开。
※ 粗体的例句和短语(都在||之后)以 \\ 隔开。
※ 对中英文标点(及其前后空格)无要求,可随个人喜好自行选择。
※ 单词的音节分隔符 · 及音标不必录入,但已录入者不必删除。
※ 正文中的 ~ 不必转换为单词,但已转换者不必修改。
※ 词源请尽量录入,但看上去毫无意义者除外(选择权完全在你手中)。
※ 冷僻汉字以拆分的形式置于【】中,如【犭+更】(若能输入“㹴”则更好)。
…………
※ 若整栏或整页缺失,则注明 ★第xxxx页(第x栏)缺★ ,等以后集中录入。
※ 若词头含非英语字母,则在该词头前添加一行代码。如:
词头 Gödel, Kürt 前需添加 godel, kurt@@@LINK="Gödel, Kürt"
(红色代码是兼容词头,非英语字母已替换为形近英语字母。)
校对中可能会用到以下这些字符(不全),请关注群文件更新:
(也可以到47楼下载fuyouyu的压缩包。)
https://www.pdawiki.com/forum/data/attachment/album/201611/26/185957pr2rrdnrnbtndobd.jpg
上面是我最近在看的一些词典,陆老的汉英上不知被我放哪里去了。
最左边朗文上面那小东西建议每人买一个,没事放手心里捏几下刺激穴位有益身心健康!
有谁认为自己藏书多的可以晒照片,我还没听说过有人比我藏书更多,当然那些买很多书却不读的有钱人例外。
本帖最后由 langwen1 于 2016-11-17 14:37 编辑
既然要重新弄,可否把每个单词下的短语、谚语、习语和俚语单列成条(增加词头索引)?这样不必到主词条下面去找短语。比如我要查找build in,不需要去build词条下再去找,一输入build in就可以找到。
如果要把短语单列成条,建议还原~号所代表的原单词,比如shift下的短语~about, ~from, 要是不还原成shift about和shift from,可能没有人弄得清楚这两个词条是啥意思,输入这两个短语又找不到(可实际上有,被~号干扰了{:4_100:} ) langwen1 发表于 2016-11-15 00:08
建议楼主把插入代码吧,您看我复制您的东西,由于没有放进放代码的,造成了复制出一堆乱码:
作成了TXT和EXCEL版本,都在压缩包里。
fuyouyu 发表于 2016-11-13 08:16
我倒建议,每一份文本应当有两人互校,即两人为一组,每组共同校阅两份,每一份文本均有初校,二校,以达到 ...
这个建议我也认同,相互校对可以将错误降至很低。 我可以参加 我也认领一份。 如果可以的话,我也想试试. 给个建议,每个报名的人先完成一定数量,比如来个5页,限一周内完成,根据这5页文本的质量,准确率达到97%以上那么可以分配50页校对工作,这50页可以放宽到2-3个月完成;如果规定时间没完成,或者准确率达不到要求就顺延发给下一位报名者;
文本的格式也要做个约定,比如按照我的标准来的话那么就是词头按照原形输入,特殊拉丁字母不要忽略,该输入é就输入é,该输入ç就输入ç等等,然后例句中的~不要转成原词,对于那些喜欢原词的用户,我可以为他们写一个一键转换的工具。
音标、词源、单词分节就不做硬性要求了,记得之前还做过一个音标输入的工具,现在我自己都找不到了{:4_109:} 词源的话建议输入,遇到不会输入的拉丁字母可以找字符映射表解决。
(以上内容仅供参考) meigen 发表于 2016-11-13 00:06
给个建议,每个报名的人先完成一定数量,比如来个5页,限一周内完成,根据这5页文本的质量,准确率达到97% ...
谢谢建议!我基本上也是这样想的。不过我没想弄成完美的版本,我的主要目的是让更多人用到这部词典。^_^
上次O版制定的规则就很好,这次只校对并补充缺失的词条。
kyletruman 发表于 2016-11-13 00:38
A大处理音标(比如美国传统词典英汉双解)弄得很好,可惜他现在决定隐退
音标完全没必要,因为英汉大的音标肯定也是从英英词典抄来的,不如直接看其它词典的音标。 本帖最后由 fuyouyu 于 2016-11-13 08:18 编辑
我倒建议,每一份文本应当有两人互校,即两人为一组,每组共同校阅两份,每一份文本均有初校,二校,以达到互相督促的效果,以提高文本质量。 fuyouyu 发表于 2016-11-13 08:16
我倒建议,每一份文本应当有两人互校,即两人为一组,每组共同校阅两份,每一份文本均有初校,二校,以达到 ...
所有文本由我二校。 humorfish 发表于 2016-11-13 09:02
这个建议我也认同,相互校对可以将错误降至很低。
我觉得楼主的这个帖子应该发到 Mdict资料库板块,可能会有更多的人看到响应,如果限定一个月或者两个月完成,可能质量会高些。招募50人左右应该还是有的。 这个我也想参加 另外特殊字符能否弄成一份文档,让人可以复制粘贴 humorfish 发表于 2016-11-13 09:13
我觉得楼主的这个帖子应该发到 Mdict资料库板块,可能会有更多的人看到响应,如果限定一个月或者两个月完 ...
春节期间能完成就不错了,参与人数肯定不会多,所以做多少算多少。 duancj 发表于 2016-11-13 10:27
另外特殊字符能否弄成一份文档,让人可以复制粘贴
词头中的冷僻字符极少,自己找一下就可以了,正文和词源中的冷僻字符可忽略。 大大,我报名参加 我也愿意参加啊。 kyletruman 发表于 2016-11-13 10:52
很多特殊字符搜狗输入法有,还是有必要弄成一份文档,让人可以复制粘贴,不要像传说中上次英汉大二文字版 ...
你不但思维有问题,而且尽说废话。
1、我上面说过词头中的特殊字符极少,碰到的时候自己去找一下就可以了。
2、O版上次的文字版做得很好,如果没有上次的版本,这次的校对补漏根本不可能进行。
3、每个人只要校对50页(工作量远小于首次录入),就可以得到全文检索版,怎么叫浪费时间和精力?
kyletruman 发表于 2016-11-13 11:10
https://www.pdawiki.com/forum/thread-17835-1-1.html
楼主可以借鉴一下baidu大的这个帖子
百度哥有他自己的方法,做出来的文本也不错。不过统筹的事情不用你操心,要不你也来50页,让大家看看你校对的能力?^_^
参加参加。我用我的实体书,校对。 试试,算我一个。 sculiuchang 发表于 2016-11-13 13:52
参加参加。我用我的实体书,校对。
再来4个人就开始!
我也有印刷版,不过一边看书一边看电脑,这样眼睛很累啊。
我也想参加。。。。 我愿参加 不支持,不反对。对国内出版的东西还是慎重点好,本身这羊肉一般,到时候还惹来一身骚,怕不划算。