掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1350|回复: 1

[求助] OCR古文的准确率?

[复制链接]
  • TA的每日心情
    擦汗
    2023-9-2 09:16
  • 签到天数: 1103 天

    [LV.10]以坛为家III

    发表于 2015-12-29 21:35:26 | 显示全部楼层 |阅读模式
    像“故训汇纂”一类的图书,中间大概会有多少汉字没有unicode编码?
    ; [' Q+ @( y. W! T' d: S有没有人在搞ocr古文训练数据?用繁体字数据tesseract-data-chi_tra将就的话,准确率能有99%吗?$ X; j. U' w8 F; N7 Q8 `
    有没有人用书籍的字体专门训练过OCR,这样识别率应该会高很多。6 p1 \3 O' I& y$ u
    abbyy finereader可以针对特殊字体专门训练吗? 如果不行的话,估计tesseract将是唯一选择了。4 s- d& J( I: z  ^
    ) W5 I. A8 j/ K3 i9 W) p
    版上大大们有过不少OCR经验,有没有人先找出印刷字体,再用此字体反复训练,这样的成效如何?
  • TA的每日心情
    奋斗
    2022-12-1 14:41
  • 签到天数: 1047 天

    [LV.10]以坛为家III

    发表于 2015-12-29 22:39:08 | 显示全部楼层
    finereader 12 好像有自定义规则,看看设置
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-12 23:28 , Processed in 0.031066 second(s), 9 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表