掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1609|回复: 1

[求助] OCR古文的准确率?

[复制链接]
  • TA的每日心情
    擦汗
    2023-9-2 09:16
  • 签到天数: 1103 天

    [LV.10]以坛为家III

    发表于 2015-12-29 21:35:26 | 显示全部楼层 |阅读模式
    像“故训汇纂”一类的图书,中间大概会有多少汉字没有unicode编码?8 |7 Y; L% B3 {# _. U
    有没有人在搞ocr古文训练数据?用繁体字数据tesseract-data-chi_tra将就的话,准确率能有99%吗?
    2 k  s/ i) ?. h2 E: c# _有没有人用书籍的字体专门训练过OCR,这样识别率应该会高很多。  A8 w8 X8 k+ b- ]5 h3 X) f$ `( K% a
    abbyy finereader可以针对特殊字体专门训练吗? 如果不行的话,估计tesseract将是唯一选择了。
    7 ?- O( [+ N7 Z( h+ V' y% x4 ^; _4 ]$ J3 i6 f/ p' g
    版上大大们有过不少OCR经验,有没有人先找出印刷字体,再用此字体反复训练,这样的成效如何?
  • TA的每日心情
    奋斗
    2022-12-1 14:41
  • 签到天数: 1047 天

    [LV.10]以坛为家III

    发表于 2015-12-29 22:39:08 | 显示全部楼层
    finereader 12 好像有自定义规则,看看设置
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-8 20:04 , Processed in 0.019048 second(s), 21 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表