掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 472|回复: 7

[讨论] 关于不能编辑类PDF文档的OCR问题

[复制链接]
  • TA的每日心情
    开心
    2024-1-12 16:56
  • 签到天数: 1044 天

    [LV.10]以坛为家III

    发表于 2020-9-3 17:41:29 | 显示全部楼层 |阅读模式
    本帖最后由 毛小驴 于 2020-9-3 17:41 编辑 & L. Y0 I4 S- W- [$ m6 w

    / ^3 }7 _4 r5 }0 V  T  s; E  看到论坛上面有许多大神的神作,有的是利用现成的数据文件进行繁复的编辑、美化,但是有的只能利用一些原始的文档文件进行扫描进而OCR,再进行繁琐的校对,对于像我这样的小白来说,光前面这些文档OCR就已经玩不转了,更不用说还有后面的校对,校对完了以后还要进行样式调整等等繁重的工作,这样一想,能制作出一部精良的词典何其艰辛,所以有的好词典进行有偿分享也是理所当然的事儿,我自己也在论文上买了好多词典,用起来自然心喜。
    : |4 f5 J5 L6 D& K" }% C  今天突然想到一个OCR PDF文档的办法:利用Adobe Acrobat Pro DC进行自动识别,其实方法很简单,直接打开pdf文档,在文件里面找到“导出到”,里面有几个选项,例如word了、HTML了、纯文档了,都是可以的,而且我用论坛上汉风宋韵发的语法文档(https://www.pdawiki.com/forum/thread-41454-1-1.html)试了下,结果竟然是出奇的好。

    . h0 D" j0 B; _  贴图为证,上面是原始pdf文档,下面的是转化后的word文档,可以对比一下 ,结果很理想,平时一些其它不可编辑文档也是可以这样转化为word格式。当然,有的大佬也许有更好更便利的ocr方法,但是那个可能对一枚小白来说不具有操作性,这个就简单多了。
    - O# P8 C) M; o+ t6 t+ d
    2 t2 p- O( @0 S8 L  A4 t$ l+ _$ @- r2 u" s

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

    发表于 2020-9-4 09:50:24 | 显示全部楼层
    即使是99%的正确率,也要全文校对一通。。。
  • TA的每日心情
    开心
    2019-12-17 15:32
  • 签到天数: 384 天

    [LV.9]以坛为家II

    发表于 2020-9-3 18:04:04 | 显示全部楼层
    感谢分享经验。表面看着不错,可问题还是在于校对耗时耗力。。

    该用户从未签到

    发表于 2020-9-3 18:52:00 | 显示全部楼层
    出奇得好0 O3 V4 S: {7 M# }, Q9 y' l

    / f6 Y3 J* F6 X5 Q' Y+ W7 M& j" p因为你选的文档是语法书呀……0 k3 }+ E' `3 m  W: k
    5 `; b8 o6 |! W" h
  • TA的每日心情
    开心
    2024-1-12 16:56
  • 签到天数: 1044 天

    [LV.10]以坛为家III

     楼主| 发表于 2020-9-3 19:43:22 | 显示全部楼层
    klwo2 发表于 2020-9-3 18:52. I) I5 _& i; |; ]& X
    出奇得好
    9 s) _# c! D1 p5 \6 ]6 V! p; m" F! @( p) a
    因为你选的文档是语法书呀……

    4 V# l9 h# X, P7 b9 o! zK大说的对,这种OCR识别针对特殊字符确实是识别率低,而且乱码也多,这个也就是给大家OCR一般的文档使用使用,复杂点的还得靠专业的来弄
  • TA的每日心情
    开心
    2023-4-1 01:10
  • 签到天数: 1992 天

    [LV.Master]伴坛终老

    发表于 2020-9-3 19:47:09 | 显示全部楼层
    OCR工具挺多的,ABBYY、福昕,关键是校对。
  • TA的每日心情
    无聊
    2022-7-21 15:56
  • 签到天数: 216 天

    [LV.7]常住居民III

    发表于 2020-9-4 10:03:23 | 显示全部楼层
    人工校对的任务有没有自动化工具来完成呀
  • TA的每日心情
    开心
    2024-1-12 16:56
  • 签到天数: 1044 天

    [LV.10]以坛为家III

     楼主| 发表于 2020-9-4 16:02:48 | 显示全部楼层
    wjl 发表于 2020-9-4 10:03
    ! \2 Z9 b% \& H# G" e人工校对的任务有没有自动化工具来完成呀
    ; q- [# U- B# P4 x; l$ E
    这个还真的是不知道,因为没有制作过,可以请教一下 klwo2、999阿彌陀佛等大神,楼上999阿彌陀佛大大也说了,即使是99%的正确率,也要全文校对一遍的,很多工具虽然自动化越来越精确,但是难免碰到一些特殊的字符了啥的,这个可能还是需要人工一遍一遍的校对了。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-1 20:28 , Processed in 0.052932 second(s), 10 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表