|
发表于 2016-9-28 08:39:12
|
显示全部楼层
本帖最后由 bt4baidu 于 2016-9-28 08:40 编辑 3 ~/ R; B: H+ M0 r# q2 t
. J) Z9 a" [" T/ Z, }3 l- {/ i如果官网的数据更新更全,可以把离线版的词头提取出来,用这个词汇表去官网抓取即可
- b- Z% M1 G& N% h9 u1 B2 Y" Q+ r& w
如果离线数据收了官网未收的单词,抓取时会报404错,自然知道官网缺哪些词,就可以把这些词从离线版里抽出来整合进去- _" n6 r6 N C1 ^8 P
( E h& H3 n+ b& ~7 K2 P至于官网收而离线未收的单词,就比较不好办,不过既然qiuhao1112之前用单词表轰过,可以用他那版的词头和新作差分一下,也就是几行代码的事情
9 e' t; h8 Z2 U2 [+ h0 {9 S2 q或者用CED的单词表和新作差分后,再去轰一下也未尝不可
9 {' ]. |7 E( m; M& b7 n% D: `
7 Y0 b& H. [3 x只提供思路,英汉词典,本人是不会出手的 |
|