|
发表于 2016-9-28 08:39:12
|
显示全部楼层
本帖最后由 bt4baidu 于 2016-9-28 08:40 编辑 . O7 A' m( E) L3 c3 ~
9 o0 L' B& l* H6 \9 B如果官网的数据更新更全,可以把离线版的词头提取出来,用这个词汇表去官网抓取即可
0 Q1 Y- o9 @ Q. \- e6 u( M" k
o6 B7 ^8 F5 |4 W: {如果离线数据收了官网未收的单词,抓取时会报404错,自然知道官网缺哪些词,就可以把这些词从离线版里抽出来整合进去
3 ~' i' W C9 B" C
5 J% t6 R0 X% P9 q; o) R至于官网收而离线未收的单词,就比较不好办,不过既然qiuhao1112之前用单词表轰过,可以用他那版的词头和新作差分一下,也就是几行代码的事情
( u# _' q1 x6 N8 m* S+ S' d或者用CED的单词表和新作差分后,再去轰一下也未尝不可
`' O1 G, a. ^. Q/ O4 N# z
+ s( }4 T4 C+ U- W+ Y只提供思路,英汉词典,本人是不会出手的 |
|