掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 683|回复: 7

[求助] 想问一下有没有提取含某单词的句子的软件?

[复制链接]
  • TA的每日心情
    慵懒
    2018-4-1 11:19
  • 签到天数: 15 天

    [LV.4]偶尔看看III

    发表于 2018-1-27 07:42:10 | 显示全部楼层 |阅读模式
    本帖最后由 akiritoa 于 2018-1-27 07:44 编辑
    8 F' D8 ?' W7 G4 ]* i: q: S; a7 s+ l" \
    / P3 W* H; n* S# V最近想自己做个简单的语料库,不求分析,只是提取出来句子。不知道有没有现成的,没有的话只能自己编写了。谢谢大家。; Q0 L5 |( L* N; X$ D* U% Z
    # d9 L  m9 I. A, v
    初级版本:6 M, d7 D* N  c1 u, O
    搜索多个文件中含有某单词的部分,然后按照句号(有例外,比如段首或小数点)来划分句子,然后将 句子|文件名。
    ' n( [& Y, W9 k" M6 q; A. @% @高级版本:
    4 b# \* W; o  z" F/ y( y给一个含有多个单词的文档,一个个单词查找,输出 所查词汇|句子|文件名
  • TA的每日心情
    开心
    2022-5-10 13:34
  • 签到天数: 141 天

    [LV.7]常住居民III

    发表于 2018-3-9 10:34:54 | 显示全部楼层
    前段时间也在找这个,楼主可以参考这篇文章,看是不是你想要的结果8 }, m) ^  J; c1 D$ r1 _
    https://zhuanlan.zhihu.com/p/24891512

    评分

    1

    查看全部评分

    该用户从未签到

    发表于 2018-1-27 18:31:50 | 显示全部楼层
    这个应该有吧? 本坛有网友提供过,叫做-ant- ,你可以搜一搜。一个网站免费提供一系列语料库软件。我当时下载了几个,但是因为目前不用,而且360报毒(可能是误报),每次360查杀都威胁要把它们删了。后来就干脆把它们删了。
  • TA的每日心情

    2018-6-15 18:18
  • 签到天数: 249 天

    [LV.8]以坛为家I

    发表于 2018-1-27 19:24:57 | 显示全部楼层
    yhemusa 发表于 2018-1-27 18:31
    . x  Z# l, S9 r3 t3 Q# V- |这个应该有吧? 本坛有网友提供过,叫做-ant- ,你可以搜一搜。一个网站免费提供一系列语料库软件。我当时 ...
    + g4 s- G' F0 Z& ~( m. C
    其实应该把360删了才对,我家电脑最近就这么干的

    该用户从未签到

    发表于 2018-1-27 23:47:59 | 显示全部楼层
    afreeelf 发表于 2018-1-27 19:24
    6 N0 W  _& f) e- p2 X# Y) S3 ]其实应该把360删了才对,我家电脑最近就这么干的
    8 I0 J6 ?$ l! Q0 P/ Z9 T
    elf, are you a girl or a boy? ;)
  • TA的每日心情

    2018-6-15 18:18
  • 签到天数: 249 天

    [LV.8]以坛为家I

    发表于 2018-1-28 07:02:41 | 显示全部楼层
    yhemusa 发表于 2018-1-27 23:47
    ! i0 c# S1 ~8 V( e# K. Belf, are you a girl or a boy? ;)

    ' s* z& r) G" X( z  U, oBoy
  • TA的每日心情
    慵懒
    2018-4-1 11:19
  • 签到天数: 15 天

    [LV.4]偶尔看看III

     楼主| 发表于 2018-1-31 12:48:23 | 显示全部楼层
    yhemusa 发表于 2018-1-27 18:311 u! Y3 \# J1 E
    这个应该有吧? 本坛有网友提供过,叫做-ant- ,你可以搜一搜。一个网站免费提供一系列语料库软件。我当时 ...
    3 ^# q1 Y2 T& v4 D, v* S
    9 |: c5 y! c8 i1 J( j
    是antconc吗?antconc好像并不能把段落或句子提取出来,只是前后各截一些字符。; a) Z3 T7 b) R8 T9 d/ M
    而且读取pdf的版本也正在研发。/ D% C- G  ^: r" ]" c. m% u* F& c, C# G
    我能用c提取txt中的段落,提取句子有点麻烦,就不试了。现在正在想用python试下pdf的提取
  • TA的每日心情
    难过
    2018-3-14 03:07
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-3-13 23:30:32 | 显示全部楼层
    全文搜索软件 filelocate不知道是不是你想要的
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-20 07:16 , Processed in 0.049381 second(s), 14 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表