|
发表于 2016-9-28 08:39:12
|
显示全部楼层
本帖最后由 bt4baidu 于 2016-9-28 08:40 编辑 1 N1 }7 `- [! A2 x9 _( H$ T3 i
2 Y( V' Y8 d( l: O9 Y m
如果官网的数据更新更全,可以把离线版的词头提取出来,用这个词汇表去官网抓取即可
) q+ y$ s$ [& y6 H% g* e+ [/ S0 a. C1 f9 h# H; \" b( M
如果离线数据收了官网未收的单词,抓取时会报404错,自然知道官网缺哪些词,就可以把这些词从离线版里抽出来整合进去. |- @+ H# i7 x
/ t+ u: v7 f$ m" P/ q9 t至于官网收而离线未收的单词,就比较不好办,不过既然qiuhao1112之前用单词表轰过,可以用他那版的词头和新作差分一下,也就是几行代码的事情
4 d8 I) p% A+ o2 P* m% R: Z或者用CED的单词表和新作差分后,再去轰一下也未尝不可
1 j3 d8 E$ Q( u! J# e7 @/ `$ ^: ]& @) o
! c& Z* i9 q, W: o只提供思路,英汉词典,本人是不会出手的 |
|