TA的每日心情 | 慵懒 2021-9-30 10:09 |
---|
签到天数: 321 天 [LV.8]以坛为家I
|
发表于 2019-9-26 17:59:52
|
显示全部楼层
本帖最后由 eplono 于 2019-9-30 07:44 编辑
* M; h# U( n6 X q% Q( k, e5 e& {! ~3 V. a |
Hi 楼主能不能做一个词组(or搭配)的词频?就是这COCA里提出来的词组或搭配按照频率越高排名越前的这样。. m1 d) M4 ?! Y, R6 k
3 ]) U) Y) R; t: E& w8 e
我相信这样一份词频,至少对很多人来说吧,远远比仅仅单词的词频有用得多(单词的词频已经有GaryPang大的iWeb词频了[搜索帖子关键词“iWeb”]),6 n3 ?; q/ C, O5 v( @$ i- b
功德无量哦
( r* P X& ]( {) L
0 Q# F4 o( {7 z( C我今年年初的时候BT(magnet:?xt=urn:btih:EEBAC1F45D81FC3EEA92A7C6CC7179C863E290B9&tr=http%3A%2F%2Fbt4.t-ru.org%2Fann%3Fmagnet)
) y$ b8 d6 j0 T( K- j) i下载了一份COCA 2012年的原始数据,- b( a5 b, u$ H: C% r
/ ^2 |! `' ^. N2 ~有一份Collocation20000的PDF(https://pan.baidu.com/s/1AOgIWHF1rZzlRsYy_JnLPQ[提取码:tetg]),(PDF转换成mdx已经有人做了,见https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33105)& C0 ?. I* F% T, Z; a% b* o1 H
9 B$ I9 b% T& k8 P& x无奈自己非IT相关专业、只会一点点Python,不会整理成搭配的词频,就把原始数据(印象中是都小说、杂志等等的原文)都删了,现在重新挂娘盘,离线几天了停在65.46%进度。: u/ n) b9 a$ O6 G% S
9 r. w3 J- H7 j/ S
等下完了就放出来希望有人做个词组(or搭配)的词频...
- x$ C8 j3 d2 O8 v6 u( f; V( c: Z4 q# p6 U9 A
咋刚才看到楼主回复进度的帖子回头看又不见了?我幻觉了???
' v( t5 m7 x" w# c; _ |
|