掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1409|回复: 7

[使用求助] 论坛里发布的各种词频数据mdx数据差异很大是什么原因?

[复制链接]

该用户从未签到

发表于 2019-4-20 10:09:18 | 显示全部楼层 |阅读模式

6 s( C8 R3 y* p9 r) X  H  c) x) W, R% B$ y+ X' D
如图,这两个“词频数据词典”,其中的COCA数据,同一词词频差很大,这是什么原因,是作者更改过原始数据吗?" o9 t4 E$ S7 V" h# R+ \% u: J
是不是只能问作者了?% R; D3 Z- o) B- N- q

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x
  • TA的每日心情
    无聊
    2022-9-25 21:09
  • 签到天数: 1136 天

    [LV.10]以坛为家III

    发表于 2019-4-20 18:29:04 | 显示全部楼层
    60000 那个是把同一字不同词性分开计算。
  • TA的每日心情
    开心
    2019-6-23 00:02
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    发表于 2019-4-20 11:47:20 | 显示全部楼层
    假设作者不会在制作过程中搞错,那我估计这和统计的时间有关,corpus也在不停地增加语料,所以随着时间的推移有可能一个词的最新词频有所改变。
    7 |  D1 L; X  O' N% @' I) ?  H另外没必要追求精确,一个词排名3000和排名5000能差到哪去,大概知道它比较重要就行了。你知道它排3000或者排3001,你能做点什么不同的事呢?

    点评

    一针见血。  发表于 2019-4-20 11:55
  • TA的每日心情
    开心
    2019-7-5 07:32
  • 签到天数: 57 天

    [LV.5]常住居民I

    发表于 2019-4-20 11:03:42 | 显示全部楼层
    本帖最后由 gsxlm 于 2019-4-20 11:06 编辑 3 J- v; F* q) l7 Q0 b- c
    ! E# u: o9 }$ k/ [
    这个是官网吗?https://www.english-corpora.org是不是跟后面的那个FREQ有关啊?5 J9 G8 u# V5 T+ S. f9 N% T; [
    6 H9 R7 N) o( d) ]% q5 P

    " B. X0 c* `# j; n" V0 |' |* P2 x( C4 ]

    ! t. u7 w1 j( ?. P7 e) m6 S3 D3 j- z+ X* H
    1 @7 y$ O' N' s% d4 J0 R# x

    * B+ n. e% [# B3 q- l# q

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2019-5-28 07:39
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2019-4-20 14:05:30 | 显示全部楼层
    语言无时无刻不在变化发展中,语料库无时无刻不在变化发展中。* E) |9 D1 j8 ~6 @  t# @; r
    就是这么的了。
  • TA的每日心情

    2019-2-16 11:33
  • 签到天数: 56 天

    [LV.5]常住居民I

    发表于 2019-4-20 16:29:41 | 显示全部楼层
    你比对一下,
    / @, N- e5 Y( y第一个 3合一 是单词的 Rank,排名
    5 H, U7 _$ _9 X3 v第二个,可能是在词库中出现的次数。
    ! M) J) V+ K" d+ M! ^- F; F4 i4 v( J4 ^4 o( M' f$ d5 z' z
  • TA的每日心情

    2019-8-31 08:44
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-8-9 20:52:49 | 显示全部楼层
    谢谢分享,谢谢分享
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-27 10:01 , Processed in 0.114317 second(s), 13 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表