|
发表于 2016-9-28 08:39:12
|
显示全部楼层
本帖最后由 bt4baidu 于 2016-9-28 08:40 编辑
) o+ c7 F* }4 c0 ^( g* {
( |# L+ d- B) A8 a/ ~如果官网的数据更新更全,可以把离线版的词头提取出来,用这个词汇表去官网抓取即可$ k- N' S5 Y, P" }3 S, _
# @. P. [; X) u: p0 O( H如果离线数据收了官网未收的单词,抓取时会报404错,自然知道官网缺哪些词,就可以把这些词从离线版里抽出来整合进去, x1 X4 m1 ^! O) s& Y+ @; _# T
& O9 O" G% L1 W# U4 \/ @# i& u
至于官网收而离线未收的单词,就比较不好办,不过既然qiuhao1112之前用单词表轰过,可以用他那版的词头和新作差分一下,也就是几行代码的事情# x! H* y9 Y& [8 |6 }- r' O
或者用CED的单词表和新作差分后,再去轰一下也未尝不可
, _! K! e2 y2 H
2 Q, d% b# H# z# W) z0 [只提供思路,英汉词典,本人是不会出手的 |
|