新人报到,分享学习!
中国科大统计方向本科生有python的nltk和jieba库基础,懂正则表达式,会基本的对做词典有帮助的NLP技术,比如命名实体,parsing,对语言学感兴趣,熟悉antconc和wordsmith一类的语言学工具
就词典而言:
做过mdx,apkg,tmx文件(tmx是CAT机助翻译记忆库文件格式)。
熟悉coca,now corpus等在线语料库
积累了很多英语语料和英汉平行语料
有2G以上的数据清洗过的口语平行语料,几乎所有句子在其中都能找到相似度极高的表达
对词根词缀词源感兴趣
坚信发音对记忆单词十分有益处:
比如con-在bmp前变com-,是因为双唇鼻音或双唇塞音前跟双唇鼻音/m/是更自然更连贯的
再如原始印欧语到现代语族中语音变化规律grimm‘s law,它可以间接导出一些词缀拼写上的变化
坚信对各种用法造句才是真正学会单词的方法
希望能和大家一起交流进步~分享劳动成果
页:
[1]