掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 686|回复: 7

[求助] 想问一下有没有提取含某单词的句子的软件?

[复制链接]
  • TA的每日心情
    慵懒
    2018-4-1 11:19
  • 签到天数: 15 天

    [LV.4]偶尔看看III

    发表于 2018-1-27 07:42:10 | 显示全部楼层 |阅读模式
    本帖最后由 akiritoa 于 2018-1-27 07:44 编辑 8 o9 ]3 \5 D( \- B* @* b
    ( D  M) L$ ?8 l, W# ]3 R% L1 X
    最近想自己做个简单的语料库,不求分析,只是提取出来句子。不知道有没有现成的,没有的话只能自己编写了。谢谢大家。8 T8 b. I( ^. J' y
    ' R( A# m; D  R* K/ j& w
    初级版本:. ]; ]8 D4 B: p9 C0 [
    搜索多个文件中含有某单词的部分,然后按照句号(有例外,比如段首或小数点)来划分句子,然后将 句子|文件名。9 L: [; O# g/ W: S. C% M" |
    高级版本:5 j6 B0 D2 M* d2 q
    给一个含有多个单词的文档,一个个单词查找,输出 所查词汇|句子|文件名
  • TA的每日心情
    开心
    2022-5-10 13:34
  • 签到天数: 141 天

    [LV.7]常住居民III

    发表于 2018-3-9 10:34:54 | 显示全部楼层
    前段时间也在找这个,楼主可以参考这篇文章,看是不是你想要的结果
    6 t3 s2 x5 j8 j5 j4 e, chttps://zhuanlan.zhihu.com/p/24891512

    评分

    1

    查看全部评分

    该用户从未签到

    发表于 2018-1-27 18:31:50 | 显示全部楼层
    这个应该有吧? 本坛有网友提供过,叫做-ant- ,你可以搜一搜。一个网站免费提供一系列语料库软件。我当时下载了几个,但是因为目前不用,而且360报毒(可能是误报),每次360查杀都威胁要把它们删了。后来就干脆把它们删了。
  • TA的每日心情

    2018-6-15 18:18
  • 签到天数: 249 天

    [LV.8]以坛为家I

    发表于 2018-1-27 19:24:57 | 显示全部楼层
    yhemusa 发表于 2018-1-27 18:31: S. w, y/ v) B! C) ~% Y
    这个应该有吧? 本坛有网友提供过,叫做-ant- ,你可以搜一搜。一个网站免费提供一系列语料库软件。我当时 ...
    : n2 y4 I: w. d
    其实应该把360删了才对,我家电脑最近就这么干的

    该用户从未签到

    发表于 2018-1-27 23:47:59 | 显示全部楼层
    afreeelf 发表于 2018-1-27 19:24
    9 O: \7 e1 \  E+ P其实应该把360删了才对,我家电脑最近就这么干的
    # ?5 D  ?4 K# b$ w4 x
    elf, are you a girl or a boy? ;)
  • TA的每日心情

    2018-6-15 18:18
  • 签到天数: 249 天

    [LV.8]以坛为家I

    发表于 2018-1-28 07:02:41 | 显示全部楼层
    yhemusa 发表于 2018-1-27 23:47' w% s8 F1 y! I7 l
    elf, are you a girl or a boy? ;)
    ; ^# v* B+ e0 J* |. t6 Z9 |  a
    Boy
  • TA的每日心情
    慵懒
    2018-4-1 11:19
  • 签到天数: 15 天

    [LV.4]偶尔看看III

     楼主| 发表于 2018-1-31 12:48:23 | 显示全部楼层
    yhemusa 发表于 2018-1-27 18:31$ W& r9 \* ?9 P' j8 E9 Q. B
    这个应该有吧? 本坛有网友提供过,叫做-ant- ,你可以搜一搜。一个网站免费提供一系列语料库软件。我当时 ...
    3 c- @$ e3 J$ p1 y" a% E& K( {9 L
    , k/ o* ?, G) i' d/ ?2 i* h
    是antconc吗?antconc好像并不能把段落或句子提取出来,只是前后各截一些字符。+ W0 [% |% i+ M- z
    而且读取pdf的版本也正在研发。
      h. s5 X2 g3 s我能用c提取txt中的段落,提取句子有点麻烦,就不试了。现在正在想用python试下pdf的提取
  • TA的每日心情
    难过
    2018-3-14 03:07
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-3-13 23:30:32 | 显示全部楼层
    全文搜索软件 filelocate不知道是不是你想要的
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-26 05:16 , Processed in 0.062389 second(s), 10 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表