掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 3009|回复: 7

[记忆库] yikelee大记忆库收词量的分析和建议

[复制链接]
  • TA的每日心情

    2018-6-17 08:57
  • 签到天数: 49 天

    [LV.5]常住居民I

    发表于 2021-4-23 12:39:06 | 显示全部楼层 |阅读模式
    本帖最后由 mahuangyihao 于 2021-4-28 11:12 编辑 0 A  b, t8 ^. k8 D
    # Q5 `6 B( |; j; p: B5 S! h
    首先感谢yikelee的各种重磅,anki是个好东西,但也得有好内容。好马配好鞍!在当今纸质书日渐走低的情况下,说实话,大多数人买了词典基本就是积灰。anki+词典的模式,可以说是词典的第二春了。
    ! {1 T6 t3 H9 N% F1 ]* C& Q/ D% ~
    yikelee大的记忆库从收词角度讲,基本分3类
    - s) z2 G  V: l$ w! ]2 [8 s初级:朗文3000
    % E) S6 G4 }. C高级:牛津5000+朗文9000(排除词组,只剩单词,去重后约8000)。这个级别托福、雅思基本够了
    + b! Y  r+ }' J词典级: 中阶词典2w+,高阶词典3w+。主要面向英语专业人士了
    4 d' Y# j$ Q! w0 y# ?- j- ~6 B6 [+ U- L. t, Z2 D$ j9 e. ?
    另外有个超级大包子,把 口语13500,牛津5000, 朗文9000,麦克米伦7000,柯林斯星级,合并去重,一共是15737个卡片。- X! U3 o; Z- U

    3 g0 |, d  C9 K2 K( w0 m8 J) S现在很多词典都标注了词频
    8 ~- ]" R3 m) x5 b& [. a. `朗文9000:分3级,每级3000。总量虽有9000,但去重后为8000
    4 A2 E! K0 `* m/ i2 E
    / G" _; a0 j: C: R- W牛津5000:牛10按照CEFR的A1~C2进行了标注,但只标了5000词
    2 ]' b# C# u3 C! U1 R( C6 _8 }# oA级 17003 m" \. U  F! Z1 r* S
    B级 1300
      S( y% m0 i- KC级 2000$ v( O* f, A. g# X6 F/ K& B7 u1 c" q) Y
    - [- R9 {! g. t
    麦克米伦6800:分了3级1 e/ l2 S# }* o/ [! b# C5 F$ A
    3星        2000
    6 o& ]( \0 C2 f* ]4 Y$ w/ x0 k7 k2星        2300' o9 ^$ _, Q4 I/ Y4 j8 S6 P
    1星        2500
    2 G0 F4 n' K1 u* q) l/ k( ~$ W# K# h
    剑桥(或CEFR)9700:完全按照CEFR的A1~C2标注,注意这里是包含了词组的,去掉词组,则只有6500
    ! m4 _+ |5 t% G9 |$ U" mA级        1700
    ) A) P* L' J: p0 TB级        5000. W, X5 `+ C" C  E
    C级        3000
    . \; A3 Y8 E  Z! T/ g' I
    - o% x/ s1 R. v1 v( a& D  ]/ g+ }# x柯林斯:柯林斯3把单词分成5级,总共标了1.6w,其中5星~2星共计8000,是最有用的。后续版本简化为3级,而且只标了3千左右,基本没啥用。但柯林斯这个分级个人感觉一般,很多不太常用的词也标了3星或2星。% K$ B% w: H0 \9 g
    5星        1300
    9 ?  f' C8 [9 x. T4星        14002 R0 H, x- e. W5 v: r/ {
    3星        1800# ?/ [0 ^3 s( Z- z- A
    2星        3400
    $ B9 w+ ?2 Z1 Q1星        82005 Z" e- w* V1 r5 ^
    1 W# F6 r! g) s" d" V" }

    + z8 f" }# g* l& b9 ^由以上统计,个人有些建议
    % D, A- N9 o$ S: `6 A1、初级收词量
    : {. B- T) M- i# H" s5 d) k朗文3000+麦克米伦3星+剑桥A级+柯林斯5星4星,我算了下,除去词组,总量3200
    ) y0 K) K3 I" L( H' }7 p% ~2 k7 O( b: I  B+ z3 {; A' Z( _

    9 w' @2 M* B- Q1 Y  a2 I. P2、高级收词量1 v7 e6 b, k3 p& i/ ]7 L
    这里需要说下牛10的词频标注,总量5000,比较尴尬,可以说是个历史遗留的问题。当初朗文异军突起,搞出个定义不出3000词,获得市场的欢迎。牛津就比较尴尬,跟风吧,放不下架子,不跟吧,市场又有需求,最后拖了几个版本,弄出个自己的5000释义词。但5000出来之后,朗文已经标注了9000词,对门剑桥也弄出了一个CEFR标准(涵盖1w词左右),这么搞基本就是把事情做绝的节奏了,因为1w词以上,统计上标注意义已经不大了。这牛津就2次尴尬了,这个在牛10上体现出来,就弄了个四不像的东西出来。
    9 b" T6 K0 e$ `  H0 q5 E8 s6 ], d5 c对于高阶词汇,我的建议是朗文9000+麦克米伦6800+剑桥9700,除去词组,总量9000+' [* O! f$ n5 N: T! Y

    1 [7 u' O# \! J- ]3、词典级! `1 s$ q0 ~! Q  U- W& t
    卡片主要还是背,整部词典感觉还是查询的场景多些。另一个场景是英语专业人士,这些人词汇量应该在1.5w或2w的样子,yikelee大做了COCA和Ngram的2w的记忆库,基本就是这个体量。  y1 p, E$ G* J4 v7 `
    我的建议是,用中阶词典的收词范围,用高阶词典的释义。就像开头说的,中阶词典收词基本在2w左右。出版社在决定不同级别词典的收词范围时,应该是有考量的,后面已经有了原始词频统计和人工筛选的工作,这个做出来一定很棒。
    : ^( x9 \8 X" H( Q$ |- Y8 e4 [; s: P: X  w' Z, G7 H
    做过词典的应该有体会——特殊情况特别多。无论你程序编的多完善,总有特殊情况,需要迭代很多次。提取首词也是这样,我在提取剑桥A1~C2单词的时候就遇到很多问题。收词量参考多部词典可以避免这种情况。
    " d, w8 N, s8 g2 G5 t8 N( p+ B1 ?1 r( a! R, D9 z  e. V$ g% V: b
    以上提到的所有词典及其收词星级等,如果yikelee大有意做的话,我可以免费分享。
    $ ~, }( s0 K: j- Z( Y3 d& l  u' V( D) C& P- k. O9 B
    本人现在用的是LONGMAN 9000 (ldoce5++) 双样式,感谢yikelee大的辛苦制作。
      \& b$ {' a4 [
    " _  k) g2 T4 A7 v' c! vanki区已经有牛9的作品,期待楼主朗文6的大作!
    ! b0 h  \) w( i9 j5 |5 Y0 p7 c/ s; u0 Q' s& J5 T  P4 }# x
    * `* j+ i  {! K# Y8 C
    1 t: J$ G% a. C: \! I' M: R
    . t. v+ p1 l' E9 d7 [) d

    本帖被以下淘专辑推荐:

  • TA的每日心情
    奋斗
    2022-10-7 09:22
  • 签到天数: 832 天

    [LV.10]以坛为家III

    发表于 2021-4-23 13:22:04 | 显示全部楼层
    口语13500是啥?
  • TA的每日心情
    擦汗
    2023-3-25 13:49
  • 签到天数: 147 天

    [LV.7]常住居民III

    发表于 2021-4-23 23:39:25 | 显示全部楼层
    我是anki重症用户,日均2000卡以上的那种。说实话,我理解不了背词典的你们——用anki来背英语词典的你们,一个单词多个释义,一个释义又有多个例句,全部汇总在一个小小的手机屏幕里,甭说看不看得过来,看起来不头大吗。虽然你们对单词进行了分级,但我想应该没几个人去对单词的释义进行分级制卡吧?就好像是学了杀鸡法,解牛技,又学了屠龙术,可是世上已经没有龙,生活中你也只需要杀杀鸡,十年都未见得有机会去解牛。我始终觉得用anki去学去背“大而全”的知识,是南辕北辙。就当作学习之余发牢骚吧,有怪莫怪。
  • TA的每日心情

    2018-6-17 08:57
  • 签到天数: 49 天

    [LV.5]常住居民I

     楼主| 发表于 2021-4-24 00:53:20 | 显示全部楼层
    本帖最后由 mahuangyihao 于 2021-4-24 00:54 编辑
    / U5 V( m' V7 e) [$ l& Q
    宁冷越 发表于 2021-4-23 23:39' R! h. g  a6 p9 t7 a0 c0 C
    我是anki重症用户,日均2000卡以上的那种。说实话,我理解不了背词典的你们——用anki来背英语词典的你们, ...

    6 F$ Z1 D7 \& `$ N  U* V7 |/ E
    " D# D" C+ ]7 c& @. o5 H回答下哈) S0 p* G& w' |# F/ k

    " v8 Y0 A! b/ J& h# P+ @背词典这种事其实也是有技巧的,首先不是所有单词都背,词典收词一般在3w+,论坛里有不少anki库都是只把9000左右常用词提取出来。其次,针对某个具体单词,朗文牛津这种学习型词典释义是按照从常用到不常用排序的,大部分单词是不需要通读全文的,只看前几个释义就好了,个别释义不清楚,再看看例句。8 H- i0 n/ A# h: O+ ]9 q! t# @1 z
    2 f, E7 {  R4 o' s) p, P" j0 x
    单词释义分级这个是有的,剑桥按照A1~C2做了标注,论坛里能搜到。
  • TA的每日心情
    无聊
    2024-4-17 09:45
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2021-4-28 11:04:59 来自手机 | 显示全部楼层
    哈哈哈,我也在等朗文,不过我是朗文5
  • TA的每日心情
    慵懒
    2023-5-20 22:40
  • 签到天数: 4 天

    [LV.2]偶尔看看I

    发表于 2021-4-29 14:28:36 | 显示全部楼层
    我正在背coca 2w,由于英语扔了十了年了,感觉anki真的不错。卡片做的很不错了。我是主要记忆中文意思,等全部过一遍之后再考虑看英文释义,过早看英文浪费时间。上下班手机背,回家翻纸词典。只有反复去看才能有效果
  • TA的每日心情
    开心
    2022-9-30 16:25
  • 签到天数: 55 天

    [LV.5]常住居民I

    发表于 2021-8-3 23:59:17 | 显示全部楼层
    宁冷越 发表于 2021-4-23 23:399 D2 s' ~6 v- Z- ?0 H
    我是anki重症用户,日均2000卡以上的那种。说实话,我理解不了背词典的你们——用anki来背英语词典的你们, ...
    ) h6 v% t0 a3 E9 Y- M
    世上没有龙是真的,最初就没有龙。屠龙刀只是名字是屠龙,实际上是用来杀人的。
    . L: ^) @; R" N) F但是世界上还是有需要记得那些超过15000词以外的词的。我看外刊经常会遇到不常见的词。但是我觉得看外刊记词,效率低。有些词反复出现,有些词好久都不出现。
    4 e4 n1 k' h% k8 t0 f7 a, J* T" _用记忆卡背词,可以系统的,无差别的,刷每一个词。; x4 @" K- N2 l5 X* X' O5 K
    至于释义,例句,我是这么来的。最开始记词,我只看中文释义。后来我看例句。朗文的例句很适合练口语,而且能刷到朗文9000词的每一个词,可以说是非常好了!再后来我看牛津的例句,牛津例句短小精悍。再后来我看柯林斯释义。
    4 Q* q  Y& c& L* @5 ?- K所以,虽然释义,例句,等很多,但是你可以挑你这个阶段想要看的,比如你这个阶段是记词,那就只看中文释义,比较快。

    该用户从未签到

    发表于 2021-8-4 10:46:20 | 显示全部楼层
    各位大侠,我也在背词典,现在在背牛津高阶加牛津简明提取出来的单词总数是五万。目的就是好玩,因为我已经退休,英语实战对我没什么用处。
    4 X6 O# _  O7 q- G# P3 v+ |背单词的过程有几个疑问请教大家:
    : G1 @* f: v( E2 W. z$ }! ^( c1,派生词怎么处理,比如 areology有派生词areological 和areologist 我一般是直接将派生词删掉,但是也有问题就是往往派生出来的词义和原意不同。- Q* V7 i/ T( j2 w2 k, S% L
    2,好多植物和矿物名词实在背不了,背了很快就忘,是不是也应该删除。比如hamamelis金缕梅,spodumene锂辉石。7 i% m; B# l, v5 u
    3,缩略语,大部分缩略语我都删了。但是那些是非常常用的呢。2 c2 z; w# O" R1 a6 M3 x% o. H6 c
    4,地名,地名我原则上只记国名和首都,但肯定有一些常用的必需记的吧。
    2 D! i3 b6 a, U0 B& b0 d/ Y! P5,人名这个也非常为难,不知道那些重要,那些不重要。0 ~% b( Z) [' |7 b5 G4 D- x+ t
    6,印度英语,我发现印度英语很多,并且都非常难背,删除怎么样。同样还有很多殖民地方言。
    7 N" g# q2 b$ R5 N/ n/ U. s请哪位大侠指教一二,感谢不尽。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-23 21:50 , Processed in 0.055721 second(s), 10 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表