TA的每日心情 | 开心 2019-7-10 10:35 |
---|
签到天数: 13 天 [LV.3]偶尔看看II
|
中国科大统计方向本科生4 p6 C4 E( S% T2 x. [* ]3 A. H
2 X" N% X6 g5 h% }5 G/ \- N
有python的nltk和jieba库基础,懂正则表达式,会基本的对做词典有帮助的NLP技术,比如命名实体,parsing,对语言学感兴趣,熟悉antconc和wordsmith一类的语言学工具" L+ f9 E( Q! p/ j
/ ?: |: q1 G+ F1 I" f+ h
* o3 T0 P4 e; w6 ~5 O8 x& R
0 s4 e* q2 d K0 G5 Q) u. x9 F9 B) t/ T M( B. Y5 ~) Q
5 I. K5 w: T: v就词典而言:
8 z7 `, a6 J) `" o# [" o7 V, |2 ?8 k9 I
做过mdx,apkg,tmx文件(tmx是CAT机助翻译记忆库文件格式)。2 C5 E4 q& P3 C! \# r0 c
6 L3 P- I0 h5 v
熟悉coca,now corpus等在线语料库
% |/ a1 u6 p0 E8 t3 R9 ~7 p
) o0 Z, [9 Z2 {! o1 k, e积累了很多英语语料和英汉平行语料8 P+ V# [ R3 @! p; L- ^5 W. ]1 R
3 t! e/ E9 `0 M$ O- b
有2G以上的数据清洗过的口语平行语料,几乎所有句子在其中都能找到相似度极高的表达
5 A6 Q& X z2 S. @, n& F# s+ d
, n; _! |% M2 p( K1 T3 m对词根词缀词源感兴趣/ x Z) \2 q+ F# s; P: Q" {
3 M* K a, q4 x* s
坚信发音对记忆单词十分有益处: B. I' |4 x( j( G/ c1 j" E! `
比如con-在bmp前变com-,是因为双唇鼻音或双唇塞音前跟双唇鼻音/m/是更自然更连贯的- l R0 g: ]" ~) [' F+ o) R
再如原始印欧语到现代语族中语音变化规律grimm‘s law,它可以间接导出一些词缀拼写上的变化
$ D$ F0 c7 G/ i: I6 S2 i! `4 i6 [' s* e D, _# h
坚信对各种用法造句才是真正学会单词的方法. Q/ C5 k/ F' c' W0 r( U0 D; f
* L' X! E& V8 }& |) I+ `2 q6 ]- g' _% \
" q& y$ O' V, K希望能和大家一起交流进步~分享劳动成果 |
|