谷歌词典的数据分析
本帖最后由 eeshu 于 2018-3-1 09:46 编辑详细研究了一下谷歌词典,发现详细释义部分其实取自The Oxford Dictionary of English,连例句和同义词这部分也是照抄无遗。请看tug和whimper条的截图:
如果展开下拉折叠部分看同义词详单的话,牛津的痕迹就更加明显了。比如tell条同义词比较多,我们来对比对比。
这部分同样抄了The Oxford Thesaurus of English,请看
显然,两部分牛津的内容都更加详细,而且更新。谷歌应该是买了老版本的牛津数据版权。论坛有本双解版的《新牛津》就是老版的,对照一下会发现谷歌内容一模一样。比如刚才查的whimper的解释,动词第一条是(of a person or animal) make a series of low, feeble sounds expressive of fear, pain, or discontent。其中的(of a person or animal)在新版中已经删除。名词解释也有调整,a low, feeble sound expressive of such emotions在新版中已经降为a whimpering sound 的下级释义。
倒是谷歌的详细例句部分,好像与牛津的例句有较大不同(BT大做的ODE是两年前的,现在的官网内容例句已经大幅增加,所以我们拿官网截图来比较比较)。还是whimper条:
我粗粗对比了一下,两部分相同的例句有20多条。看来谷歌可能利用自己的海量数据还是增加了一部分自己的例句。不过,牛津官网的例句数量远远多于谷歌的。只可惜BT大觉得牛津官网更新后删了一些老版中有用的内容(比如词源详解和rhyme),不肯再制作更新版本。
所以,经过上面一番对比,真正是谷歌自己独特数据的恐怕只有英汉简译部分。
研究的细致!!!赞一个!!! 感谢大神分析!赞
页:
[1]