|
发表于 2016-9-28 08:39:12
|
显示全部楼层
本帖最后由 bt4baidu 于 2016-9-28 08:40 编辑 8 i# }; ~: f! }) [ |% H0 n6 ^
* Z6 @9 M7 Z; ]; N) H
如果官网的数据更新更全,可以把离线版的词头提取出来,用这个词汇表去官网抓取即可
) E# ~) k, v8 w7 r* [9 |; e! m, _ q7 T% r
如果离线数据收了官网未收的单词,抓取时会报404错,自然知道官网缺哪些词,就可以把这些词从离线版里抽出来整合进去
3 e2 H" v+ n0 o4 M' m1 V
6 Y0 J$ v, c# T; Y至于官网收而离线未收的单词,就比较不好办,不过既然qiuhao1112之前用单词表轰过,可以用他那版的词头和新作差分一下,也就是几行代码的事情# n8 L6 Z# j# A2 Z5 Y4 p: K+ \3 U
或者用CED的单词表和新作差分后,再去轰一下也未尝不可
" M5 \8 b/ n; E( _0 G3 b: f
! n$ b- i- a- Q. E/ o. v4 t2 s只提供思路,英汉词典,本人是不会出手的 |
|