TA的每日心情 | 衰 2018-6-17 08:57 |
---|
签到天数: 49 天 [LV.5]常住居民I
|
本帖最后由 mahuangyihao 于 2021-4-28 11:12 编辑 0 A b, t8 ^. k8 D
# Q5 `6 B( |; j; p: B5 S! h
首先感谢yikelee的各种重磅,anki是个好东西,但也得有好内容。好马配好鞍!在当今纸质书日渐走低的情况下,说实话,大多数人买了词典基本就是积灰。anki+词典的模式,可以说是词典的第二春了。
! {1 T6 t3 H9 N% F1 ]* C& Q/ D% ~
yikelee大的记忆库从收词角度讲,基本分3类
- s) z2 G V: l$ w! ]2 [8 s初级:朗文3000
% E) S6 G4 }. C高级:牛津5000+朗文9000(排除词组,只剩单词,去重后约8000)。这个级别托福、雅思基本够了
+ b! Y r+ }' J词典级: 中阶词典2w+,高阶词典3w+。主要面向英语专业人士了
4 d' Y# j$ Q! w0 y# ?- j- ~6 B6 [+ U- L. t, Z2 D$ j9 e. ?
另外有个超级大包子,把 口语13500,牛津5000, 朗文9000,麦克米伦7000,柯林斯星级,合并去重,一共是15737个卡片。- X! U3 o; Z- U
3 g0 |, d C9 K2 K( w0 m8 J) S现在很多词典都标注了词频
8 ~- ]" R3 m) x5 b& [. a. `朗文9000:分3级,每级3000。总量虽有9000,但去重后为8000
4 A2 E! K0 `* m/ i2 E
/ G" _; a0 j: C: R- W牛津5000:牛10按照CEFR的A1~C2进行了标注,但只标了5000词
2 ]' b# C# u3 C! U1 R( C6 _8 }# oA级 17003 m" \. U F! Z1 r* S
B级 1300
S( y% m0 i- KC级 2000$ v( O* f, A. g# X6 F/ K& B7 u1 c" q) Y
- [- R9 {! g. t
麦克米伦6800:分了3级1 e/ l2 S# }* o/ [! b# C5 F$ A
3星 2000
6 o& ]( \0 C2 f* ]4 Y$ w/ x0 k7 k2星 2300' o9 ^$ _, Q4 I/ Y4 j8 S6 P
1星 2500
2 G0 F4 n' K1 u* q) l/ k( ~$ W# K# h
剑桥(或CEFR)9700:完全按照CEFR的A1~C2标注,注意这里是包含了词组的,去掉词组,则只有6500
! m4 _+ |5 t% G9 |$ U" mA级 1700
) A) P* L' J: p0 TB级 5000. W, X5 `+ C" C E
C级 3000
. \; A3 Y8 E Z! T/ g' I
- o% x/ s1 R. v1 v( a& D ]/ g+ }# x柯林斯:柯林斯3把单词分成5级,总共标了1.6w,其中5星~2星共计8000,是最有用的。后续版本简化为3级,而且只标了3千左右,基本没啥用。但柯林斯这个分级个人感觉一般,很多不太常用的词也标了3星或2星。% K$ B% w: H0 \9 g
5星 1300
9 ? f' C8 [9 x. T4星 14002 R0 H, x- e. W5 v: r/ {
3星 1800# ?/ [0 ^3 s( Z- z- A
2星 3400
$ B9 w+ ?2 Z1 Q1星 82005 Z" e- w* V1 r5 ^
1 W# F6 r! g) s" d" V" }
+ z8 f" }# g* l& b9 ^由以上统计,个人有些建议
% D, A- N9 o$ S: `6 A1、初级收词量
: {. B- T) M- i# H" s5 d) k朗文3000+麦克米伦3星+剑桥A级+柯林斯5星4星,我算了下,除去词组,总量3200
) y0 K) K3 I" L( H' }7 p% ~2 k7 O( b: I B+ z3 {; A' Z( _
9 w' @2 M* B- Q1 Y a2 I. P2、高级收词量1 v7 e6 b, k3 p& i/ ]7 L
这里需要说下牛10的词频标注,总量5000,比较尴尬,可以说是个历史遗留的问题。当初朗文异军突起,搞出个定义不出3000词,获得市场的欢迎。牛津就比较尴尬,跟风吧,放不下架子,不跟吧,市场又有需求,最后拖了几个版本,弄出个自己的5000释义词。但5000出来之后,朗文已经标注了9000词,对门剑桥也弄出了一个CEFR标准(涵盖1w词左右),这么搞基本就是把事情做绝的节奏了,因为1w词以上,统计上标注意义已经不大了。这牛津就2次尴尬了,这个在牛10上体现出来,就弄了个四不像的东西出来。
9 b" T6 K0 e$ ` H0 q5 E8 s6 ], d5 c对于高阶词汇,我的建议是朗文9000+麦克米伦6800+剑桥9700,除去词组,总量9000+' [* O! f$ n5 N: T! Y
1 [7 u' O# \! J- ]3、词典级! `1 s$ q0 ~! Q U- W& t
卡片主要还是背,整部词典感觉还是查询的场景多些。另一个场景是英语专业人士,这些人词汇量应该在1.5w或2w的样子,yikelee大做了COCA和Ngram的2w的记忆库,基本就是这个体量。 y1 p, E$ G* J4 v7 `
我的建议是,用中阶词典的收词范围,用高阶词典的释义。就像开头说的,中阶词典收词基本在2w左右。出版社在决定不同级别词典的收词范围时,应该是有考量的,后面已经有了原始词频统计和人工筛选的工作,这个做出来一定很棒。
: ^( x9 \8 X" H( Q$ |- Y8 e4 [; s: P: X w' Z, G7 H
做过词典的应该有体会——特殊情况特别多。无论你程序编的多完善,总有特殊情况,需要迭代很多次。提取首词也是这样,我在提取剑桥A1~C2单词的时候就遇到很多问题。收词量参考多部词典可以避免这种情况。
" d, w8 N, s8 g2 G5 t8 N( p+ B1 ?1 r( a! R, D9 z e. V$ g% V: b
以上提到的所有词典及其收词星级等,如果yikelee大有意做的话,我可以免费分享。
$ ~, }( s0 K: j- Z( Y3 d& l u' V( D) C& P- k. O9 B
本人现在用的是LONGMAN 9000 (ldoce5++) 双样式,感谢yikelee大的辛苦制作。
\& b$ {' a4 [
" _ k) g2 T4 A7 v' c! vanki区已经有牛9的作品,期待楼主朗文6的大作!
! b0 h \) w( i9 j5 |5 Y0 p7 c/ s; u0 Q' s& J5 T P4 }# x
* `* j+ i {! K# Y8 C
1 t: J$ G% a. C: \! I' M: R
. t. v+ p1 l' E9 d7 [) d
|
|