掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 434|回复: 2

[求助] 如何提取OCR识别出的可编辑PDF中黑体词条?

[复制链接]
  • TA的每日心情
    无聊
    2022-7-21 15:56
  • 签到天数: 216 天

    [LV.7]常住居民III

    发表于 2020-7-9 19:08:04 | 显示全部楼层 |阅读模式
    如何提取OCR识别出的可编辑PDF中黑体词条?
      Q3 ]: x! i  q" D4 {: [! Y如下动图所示,有一个根据扫描PDF识别出的可编辑格式PDF,感觉其中的词条识别结果正确率很高,释义和例句部分的识别结果估计有错误。有什么工具能提取出其中的词条吗?方便做图片词典,可能的话,还可以提取出其中的释义和例句,方便做成文本格式的mdx,不过做mdx之前,需要仔细校对这些文本
    6 }7 j8 t) x% g( |, T/ c, d7 ]5 o( H$ B$ N

    5 J' m. ^: n/ b: \

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2020-7-9 21:13:08 | 显示全部楼层
    如果不借用工具的话(比如chigre的工具),最直接的办法就是复制粘贴9 G) V. r; l1 H
    " x2 T  ^0 d) _: Z6 K
    当然了你肯定不喜欢这个费时费力的答案,但是目前来看就是这样
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2020-7-10 00:07:24 | 显示全部楼层
    导出成docx或者txt看看
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-25 19:43 , Processed in 0.043706 second(s), 8 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表