掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 980|回复: 7

[求助] 请教,怎么从一篇文章中提取词组?

[复制链接]
  • TA的每日心情

    2018-6-17 08:57
  • 签到天数: 49 天

    [LV.5]常住居民I

    发表于 2017-12-22 13:33:05 | 显示全部楼层 |阅读模式
    英文是天然分词,但词组怎么弄呢。8 f$ ]  p8 O" c( P* n

    8 q) e) Y& c5 A" F* \9 W现在有成熟的方法能从文章中把词组都提取出来吗?
  • TA的每日心情
    开心
    2023-2-24 18:44
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2018-3-15 10:32:56 | 显示全部楼层
    比如说中文是没有空格的 可以用 Stanford POS Segmenter 来分词
    # N; @+ N, x2 I" {3 P+ [那么英语要分词组也是一样的 首先需要英文词组的切割算法(算法模型)然后在需要有软件3 k8 J, O; B% ]& ^3 m% C5 U
    不过目前只看到过中文分词软件 没见过英文分词组的软件(可能词组不如词语那么好判断)
  • TA的每日心情

    2018-6-17 08:57
  • 签到天数: 49 天

    [LV.5]常住居民I

     楼主| 发表于 2018-3-15 10:46:34 | 显示全部楼层
    blkserene 发表于 2018-3-15 10:32# J) n+ p& [; U/ t  R
    比如说中文是没有空格的 可以用 Stanford POS Segmenter 来分词3 C6 p4 v% P. |* Y& g  e6 u
    那么英语要分词组也是一样的 首先需要英文 ...
    / l& w0 Z; B+ N7 Q
    听说过python 的NLTK,但没细研究过,这应该是很完善的库了。不知道这里有没有
  • TA的每日心情
    开心
    2023-2-24 18:44
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2018-3-15 10:47:51 | 显示全部楼层
    forestryboy 发表于 2017-12-23 17:36
    " ?, ]% T# T/ C( n$ ?( t1 V/ M用ANTCONC
    0 q8 D& Z  J1 f7 b% d2 M2 s
    antconc 只是语料库分析软件 他自己没法切割词组。。
  • TA的每日心情

    2018-6-17 08:57
  • 签到天数: 49 天

    [LV.5]常住居民I

     楼主| 发表于 2018-3-15 10:50:53 | 显示全部楼层
    forestryboy 发表于 2017-12-23 17:367 B4 z5 g7 G5 h0 Z/ J9 L
    用ANTCONC

    ! n5 Q* J+ k- M0 `非常感谢,看了下文档,貌似Collocates Tool是我想要的
  • TA的每日心情
    开心
    2018-3-16 06:15
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2018-3-16 15:58:53 | 显示全部楼层
    mahuangyihao 发表于 2018-3-15 10:50
    & f& i) Z$ O3 I0 j+ J+ Y) D- L非常感谢,看了下文档,貌似Collocates Tool是我想要的
    : ~& ~* y' B+ _% s! Y5 z' n+ s- r# i
    RT

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2020-11-30 19:14
  • 签到天数: 249 天

    [LV.8]以坛为家I

    发表于 2018-3-20 22:20:24 | 显示全部楼层
    谢谢,好像对我也有用。研究一下。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-7 08:37 , Processed in 0.021487 second(s), 22 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表