掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 687|回复: 7

[求助] 想问一下有没有提取含某单词的句子的软件?

[复制链接]
  • TA的每日心情
    慵懒
    2018-4-1 11:19
  • 签到天数: 15 天

    [LV.4]偶尔看看III

    发表于 2018-1-27 07:42:10 | 显示全部楼层 |阅读模式
    本帖最后由 akiritoa 于 2018-1-27 07:44 编辑 - i3 ]4 l4 O# C

    - g  I# \' W1 d* x% m最近想自己做个简单的语料库,不求分析,只是提取出来句子。不知道有没有现成的,没有的话只能自己编写了。谢谢大家。9 s- ?1 m) I$ W, b
    : k; Q/ ?7 ^2 w, N- n. A6 M3 f
    初级版本:
    $ @1 q# Z0 B9 x  q) e) b( l: W搜索多个文件中含有某单词的部分,然后按照句号(有例外,比如段首或小数点)来划分句子,然后将 句子|文件名。
    , F0 t  H1 w. D! z- W& `高级版本:
    8 B) Q. S% _0 G2 S给一个含有多个单词的文档,一个个单词查找,输出 所查词汇|句子|文件名
  • TA的每日心情
    开心
    2022-5-10 13:34
  • 签到天数: 141 天

    [LV.7]常住居民III

    发表于 2018-3-9 10:34:54 | 显示全部楼层
    前段时间也在找这个,楼主可以参考这篇文章,看是不是你想要的结果* x7 \5 ?2 a7 V# H1 O
    https://zhuanlan.zhihu.com/p/24891512

    评分

    1

    查看全部评分

    该用户从未签到

    发表于 2018-1-27 18:31:50 | 显示全部楼层
    这个应该有吧? 本坛有网友提供过,叫做-ant- ,你可以搜一搜。一个网站免费提供一系列语料库软件。我当时下载了几个,但是因为目前不用,而且360报毒(可能是误报),每次360查杀都威胁要把它们删了。后来就干脆把它们删了。
  • TA的每日心情

    2018-6-15 18:18
  • 签到天数: 249 天

    [LV.8]以坛为家I

    发表于 2018-1-27 19:24:57 | 显示全部楼层
    yhemusa 发表于 2018-1-27 18:31% R6 @( }7 n0 W) F) c- ]
    这个应该有吧? 本坛有网友提供过,叫做-ant- ,你可以搜一搜。一个网站免费提供一系列语料库软件。我当时 ...

    , Y7 }# d8 i$ x# [- h7 i其实应该把360删了才对,我家电脑最近就这么干的

    该用户从未签到

    发表于 2018-1-27 23:47:59 | 显示全部楼层
    afreeelf 发表于 2018-1-27 19:24
    4 U2 {5 S- C$ _. }其实应该把360删了才对,我家电脑最近就这么干的
    $ }- E3 M: a- S) H5 \
    elf, are you a girl or a boy? ;)
  • TA的每日心情

    2018-6-15 18:18
  • 签到天数: 249 天

    [LV.8]以坛为家I

    发表于 2018-1-28 07:02:41 | 显示全部楼层
    yhemusa 发表于 2018-1-27 23:47
    6 h+ O( a% l+ c. ], a. w, D0 b# K0 Helf, are you a girl or a boy? ;)
    5 T5 m' T0 K- H" ~8 w+ o+ D4 O
    Boy
  • TA的每日心情
    慵懒
    2018-4-1 11:19
  • 签到天数: 15 天

    [LV.4]偶尔看看III

     楼主| 发表于 2018-1-31 12:48:23 | 显示全部楼层
    yhemusa 发表于 2018-1-27 18:31
    ; v4 K3 r8 j2 F4 z这个应该有吧? 本坛有网友提供过,叫做-ant- ,你可以搜一搜。一个网站免费提供一系列语料库软件。我当时 ...

      D* V5 p. R$ D' a- S% N! w# ~; x' c2 Z3 v2 s% l
    是antconc吗?antconc好像并不能把段落或句子提取出来,只是前后各截一些字符。$ H6 w/ \: ^$ {/ I' {
    而且读取pdf的版本也正在研发。+ N8 W9 b5 p/ g9 F
    我能用c提取txt中的段落,提取句子有点麻烦,就不试了。现在正在想用python试下pdf的提取
  • TA的每日心情
    难过
    2018-3-14 03:07
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-3-13 23:30:32 | 显示全部楼层
    全文搜索软件 filelocate不知道是不是你想要的
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-26 11:43 , Processed in 0.047369 second(s), 13 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表