TA的每日心情 | 慵懒 2021-9-30 10:09 |
---|
签到天数: 321 天 [LV.8]以坛为家I
|
发表于 2019-9-26 17:59:52
|
显示全部楼层
本帖最后由 eplono 于 2019-9-30 07:44 编辑
9 F- x3 W, g; K9 W/ k
# i1 P8 j4 Z1 L: gHi 楼主能不能做一个词组(or搭配)的词频?就是这COCA里提出来的词组或搭配按照频率越高排名越前的这样。% p& z8 O9 V0 i0 r( ^3 }4 \* P
" T6 |, J+ y8 k# t# m我相信这样一份词频,至少对很多人来说吧,远远比仅仅单词的词频有用得多(单词的词频已经有GaryPang大的iWeb词频了[搜索帖子关键词“iWeb”]),4 L- ~1 H- ?* `7 s& z
功德无量哦: \& S& M% Q0 k# Q% k
' Y0 y7 f$ G0 d4 z4 B1 Q1 Y
我今年年初的时候BT(magnet:?xt=urn:btih:EEBAC1F45D81FC3EEA92A7C6CC7179C863E290B9&tr=http%3A%2F%2Fbt4.t-ru.org%2Fann%3Fmagnet)3 y2 W3 q" w' p# o( ?6 N/ i
下载了一份COCA 2012年的原始数据,
F2 A+ P- u: ]' S
- }/ P4 u! @. `, s有一份Collocation20000的PDF(https://pan.baidu.com/s/1AOgIWHF1rZzlRsYy_JnLPQ[提取码:tetg]),(PDF转换成mdx已经有人做了,见https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33105)
: P z, M m) _$ M4 S7 U, G- h' `4 i% j }3 J& S
无奈自己非IT相关专业、只会一点点Python,不会整理成搭配的词频,就把原始数据(印象中是都小说、杂志等等的原文)都删了,现在重新挂娘盘,离线几天了停在65.46%进度。$ z! B: E+ y+ X G
# R2 Y! x3 k0 P- i
等下完了就放出来希望有人做个词组(or搭配)的词频...
% s% e& y; i; |3 e8 D, n
% O" s, q6 b H% a咋刚才看到楼主回复进度的帖子回头看又不见了?我幻觉了???
* b6 B& e) \8 q' ^) | |
|