|
发表于 2016-7-4 00:52:23
|
显示全部楼层
本帖最后由 fnaviwwo1 于 2016-7-4 00:59 编辑
" k6 D. E, e! ~. T( P, slxchen2001 发表于 2016-7-3 23:43% j' R# N. z9 z9 C0 f6 n
看了一下您说得的,但觉得有几个地方需要考虑 。
0 C% a& ~) ?( o/ K. @; H
0 X; q9 S6 t9 ?0 P y. d) }- 有些句子很长,可能是40-50个词,这种情况下怎么 ...
; r1 Z* r/ t: H# Z5 B4 I
8 f. [0 @! \; ^+ s/ @- Q) c# c我就是说说想法啦,希望能和您一同探讨可行性。$ S3 q, ^0 ^1 G% C
5 W& e; q7 m' M7 G) }% y( Z% d* [; d4 z
之前看到论坛里有大神做过国内考试真题的词典,感觉效果非常棒。1 B5 u% C' o; F4 p' u
[取自考研英语真题]1997-2015年真题单词、词频、意思及其例句% @, a9 Q1 ]9 @7 J T% ]" x3 H, s
也看到有大神做过新概念英语的词典。) d/ ]1 z5 I8 D0 P! z
[英-英] 新概念英语全文句库# q0 G# E2 m1 }$ J1 S3 a; R% F
4 p/ A% }, r- N. [& S; R) W
简单词的问题,nltk有个stopwords列表,这些词不要' \. e: K9 v9 l1 v( g
- >>> from nltk.corpus import stopwords0 {9 P: ^) q" c1 ^7 Z. U) v
- >>> stopwords.words('english')
; q) m# s) Q& L* W - ['i', 'me', 'my', 'myself', 'we', 'our', 'ours', 'ourselves', 'you', 'your', 'yours',
2 ~" ^5 P( x. M+ H# [0 R+ W2 d - 'yourself', 'yourselves', 'he', 'him', 'his', 'himself', 'she', 'her', 'hers',
; ?1 c% W A: C3 r - 'herself', 'it', 'its', 'itself', 'they', 'them', 'their', 'theirs', 'themselves',
4 G2 j3 B& X7 `9 P* }6 _4 r - 'what', 'which', 'who', 'whom', 'this', 'that', 'these', 'those', 'am', 'is', 'are',
- f/ x& `+ y4 S: |% E - 'was', 'were', 'be', 'been', 'being', 'have', 'has', 'had', 'having', 'do', 'does',
% a. ?' Q# ^; M; M" H* k- Q - 'did', 'doing', 'a', 'an', 'the', 'and', 'but', 'if', 'or', 'because', 'as', 'until',
$ |0 M+ g/ ]3 y* G' c+ u8 Y - 'while', 'of', 'at', 'by', 'for', 'with', 'about', 'against', 'between', 'into',
) y, I! k6 x& T9 l- p( ]# G - 'through', 'during', 'before', 'after', 'above', 'below', 'to', 'from', 'up', 'down',& I- F- T# w( `( E" X2 @$ `) L
- 'in', 'out', 'on', 'off', 'over', 'under', 'again', 'further', 'then', 'once', 'here',
9 d" S! i- c1 i/ M9 ~, | - 'there', 'when', 'where', 'why', 'how', 'all', 'any', 'both', 'each', 'few', 'more',
" ]; x) N: y; p, q, C7 T7 D - 'most', 'other', 'some', 'such', 'no', 'nor', 'not', 'only', 'own', 'same', 'so',) g# e4 s8 B0 X- n8 k) t0 g% I
- 'than', 'too', 'very', 's', 't', 'can', 'will', 'just', 'don', 'should', 'now']
复制代码 $ e H. m9 t7 v/ L# M5 R1 `
/ v7 ?4 t$ x$ h: f" f关于词典的布局,因为特定于某一们考试,句子的数量虽然大但是还是很有限。) s" U/ B( ~0 a# J
确实每个句子会有很多词(还包括词型变化),如果每个句子都放到他出现的单词下面会有很多冗余。
/ d4 [$ |7 _" V7 T8 q感觉可以设置很多不存在的词条来放句子,比如 id_0001->一个句子,这样子。
0 z1 d* B1 p, o1 m9 }! A) E+ n然后利用mdict的@@@link功能,句子里的每个单词都连接到句子,mdict会直接显示链接后的结果的。
4 `) f" O% Q( R) X) Z% R, O
$ R; o8 ^' ]" D7 P2 e这些冗余因为mdx是压缩保存的,我觉得重复的问题也不是不大。1 x: ]8 Z( J1 r; e
8 R$ x1 y3 x# D
通过不同的单词下重复若干经典例句,会给单词留下非常深刻的印象,个人感觉比直接背孤立单词(特别是释义很长的时候)有效果。
: Z* {7 n( W3 o% E
- m) }! J. V3 n5 j题外话:# p t5 e7 J6 b7 L4 v* }; T/ A
新东方的有些单词书例句看着真不爽,感觉怪怪的。 |
|