【求解惑】Word Frequency List of American English20000
Word Frequency List of American English 20000的pdf我看了很多遍,它前面对各个英文字母和数字的说明我实在没看懂,哪位高人能用汉语帮我解释一下这些不同的标注,像pos(pos是什么意思?)这栏下的字母分别表示什么意思? 还有pdf中的不同位置位置的数字各代表什么意思?(我只弄懂了每个词条前数字的意思)0.00 – 1.00表示什么?这部词频词典网址: http://www.wordfrequency.info/free.asp?s=y ,这个词典的两个pdf下载链接: 链接: http://pan.baidu.com/s/1slCEA77 密码: bsr4
另外,请高人指点一下,这部词典怎么用?谢谢!
PoS: part of speech, 单词的词性,如名词、动词、介词 前言里面有解释。大概的意思:
pos:词性。(动词、名词。。。。)
0.0-1.0:‘分散度’,也就是这个词在整个语料库中的分布的‘均匀度’,(譬如一个科技词汇,可能就主要分布在academic类里面,这样分散度就低;反之一个通用词汇,就会均匀分布在各大子类中) 本帖最后由 kyletruman 于 2016-5-12 22:47 编辑
coca20000式样 就是这部词频词典,我问了很多人,他们也不知道这部词典里的各个符号和数字各代表什么。
请各位大神恕在下愚钝,不要取笑在下。若各位大神能给在下解惑,在下感激不尽。 另外关于rank(排名),由于语料库和采样的不同,COCA5000,2万,6万,10万是有区别的。但是总体的趋势是一致的,都严格反映了当代美语的特点。 belleyeah 发表于 2016-5-12 19:42
前言里面有解释。大概的意思:
pos:词性。(动词、名词。。。。)
0.0-1.0:‘分散度’,也就是这个词在 ...
好专业的解释!! belleyeah 发表于 2016-5-12 19:49
另外关于rank(排名),由于语料库和采样的不同,COCA5000,2万,6万,10万是有区别的。但是总体的趋势是一 ...
pos词性这一块我只知道v和n代表动词和名词,但是pos下的其他字母像m, n, j, i, r, c, p, a, t, d, p, x(感觉这些字母好像是从A到Z排列的),我确实不知道它们代表的意思。您能否给我讲一讲它们具体指什么吗?
谢谢! 本帖最后由 kyletruman 于 2016-5-12 23:19 编辑
这里截的图是在原网页截的;还有一些没截图,在wordfreq20000pdf文档里
是这个吗?
a article
c conjunction
d determiner
e existential
g genitive
i preposition
j adjective
m number
n noun
p pronoun
r adverb
t to
u interjection
v verb
x negation wawxing 发表于 2016-5-13 08:02
是这个吗?
好像是,谢谢您的解答! 各位大神能否再回答我一个问题吗?
举例来说,词条think下的数字772787表示什么意思呢?
(我做出了各种设想,但感觉都不对。)
恳请各位大神指教,谢谢! kyletruman 发表于 2016-5-13 13:04
各位大神能否再回答我一个问题吗?
举例来说,词条think下的数字772787表示什么意思呢?
(我做出了各种设 ...
语料库出现的总次数。
页:
[1]