怎么发现的?
参考:
https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=13388&extra=page%3D1&_dsign=33122e17
解压mdx, 然后用EmEditor编辑, 显示有错误, 跳到第一个无效字符去看就发现乱码,
接下来随意多查几个词, 对比手上的书, 就会看到很多有排版错误, 乱码, 缺漏…
查找类似的字符串, 发现还有更多问题..修了几天上千个问题点之后, 暂时放弃了.
因为还有更有意思的词典要处理, 原始数据很乱, 排版应该是故意弄乱的,
向leaving竟然分成leav和ing , 中间故意夹了一些空白.
要修复要用较复杂的 正则+宏指令 处理超过百万次…
要分批慢慢弄,加上PC处理速度很慢, 要处理一阵子..
但是这个数据正确性比较高, 只要专心处理排版..
后续再针对小部分的内容作增加/修改/校对即可.
数据核查可以用微软日本出的Bookself
其主要包括以下三种词典,分别是:
1,三省堂新明解国語辞典(第五版):起源于1934年的历史级国语辞典.软件里的是2000年左右发行的第五版.里面收录了约75,000词.
2,研究社新和英中辞典(第4版):一本实用的和英词典.收录了约70,000词.
3,研究社新英和中辞典(第6版):一本多用途的英和词典.收录约90,000单词,其中40,000带有美国标准发音.
词典解释都比较详细,不少地方都有单词的用法和例句.
特别注意:安装完以后会要求注册,选择以后注册就可以使用了。此后该软件会随着系统启动而启动,注意不要用其他软件修改它的启动选项(随系统启动),否则会一直提示注册。
自取:链接:http://pan.baidu.com/s/1hreqHBe 密码:qmtu
程序中的版权信息:
著作権表示
--------------------------------------------------------------------------------
(C) & (P) 1987-2001 Microsoft Corporation. All rights reserved.
Kenkyusha's New College English-Japanese Dictionary, Sixth edition (C) Kenkyusha Ltd. 1967,1994,1998/新英和中辞典 第6版 (C) 研究社 1967,1994,1998
Kenkyusha's New College Japanese-English Dictionary, Fourth edition (C) Kenkyusha Ltd. 1933,1995,1998/新和英中辞典 第4版 (C) 研究社 1933,1995,1998
Shin Meikai Kokugo Jiten Dictionary, Fifth edition (C) Sanseido Co., Ltd. 1972,1974,1981,1989,1997/新明解国語辞典 第五版 (C) 三省堂 1972,1974,1981,1989,1997
Portions of International CorrectSpellTM spelling correction system (C) 1993 by Lernout & Hauspie Speech Products N.V. All rights reserved.
New College English-Japanese Dictionary, 6th edition (C) Kenkyusha Ltd. 1967,1994,1998
PS. {:4_112:} 英和中辞典的中是中级的意思而不是中文.
sky66 发表于 2015-2-26 16:54
以内容而言 “21世纪” 这个mdx就蛮多问题的. 需要慢慢花时间去处理改善.
乱码:
确实如此 挺好 MYsedulous 发表于 2015-1-15 13:50
纪氏乃梁实秋高足,这本词典确实已在90年代初引进大陆,但后有新版,我手头的湾版显示有53,000字汇,另附 ...
我想买这本书 这个辞典不好买哦 大熊部落 发表于 2015-1-13 19:32
上面这本辞典的蓝本是New Approach English-Japanese Dictionary,主编是伊藤健三和广濑和清,由日本东 ...
如果21世纪英汉词典与林连祥的《新世纪英汉辞典》一致,那么就不可能和《新知识英汉辞典》是同一本辞书。
页:
1
[2]