掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1392|回复: 6

[求助] 如何正确地OCR识别出音标避免乱码?

[复制链接]
  • TA的每日心情
    擦汗
    2020-7-3 13:51
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2020-9-28 16:57:24 | 显示全部楼层 |阅读模式
    用ACROBAT自带的OCR处理词典页面,发现音标识别出来绝大部分都有乱码。不知道如何解决?

    该用户从未签到

    发表于 2020-9-28 19:13:06 | 显示全部楼层
    本帖最后由 klwo2 于 2020-9-28 19:24 编辑
    / O1 f# I6 H& u" d- r
    leescott 发表于 2020-9-28 17:41) C" V8 H, B7 w$ \! C$ V4 \) q/ X
    FineReader和 TESSERACT可能比较好。) l2 W7 x5 j; n9 s
    下面最后有篇文章,用FineReader 。) x! N# L; Z) S. r# T; J
    https://www.researchgate.net/po ...
    5 C0 _' D$ m6 Z, k9 }8 S' A
    理论上,FineReader可以自制语言,把IPA包进来就行了。可是实际效果不行:4 n: c, i# o+ t; l/ j% Y5 f. D/ q

    1 W* b9 V  D: N! q1 `+ O( d3 n) |6 B# X$ `6 {& e4 u
    5 B8 O6 p4 f( d6 E* t/ p
    试了多个配置,/ʃəs/ 就是不能识别,/ʃəs/ 有多常见大家都知道. w; G6 ~  {4 N, i& l; ^# r) x$ R3 C% t
    5 k9 Z1 z5 G7 T
    更何况楼主想要的,估计是中文也准、英文也准,最好音标还不出错,有这么美的事儿,英汉词典早就大跃进变文字版了
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2020-9-28 17:10:11 | 显示全部楼层
    starmars 兄,你這不是多問的嗎?,英文字母都不一定正確了,更何況是音標呢!

    该用户从未签到

    发表于 2020-9-28 17:20:56 | 显示全部楼层
    解决不了
    , x( u' B! s6 Z- m+ i9 a1 g5 ^  q# P
    英语词典里的【国际音标】,其实只是国际音标的子集。下面这些,也是国际音标:
    - |7 R$ w5 x" z2 J9 i: C4 Q9 `/ q% n
    1 t9 H) i* Q! l5 Q7 ^

    ' T2 }$ Y  w- d又有帽子又有尾巴
    # @9 w6 {( Q" C( B( s8 n7 o
      I$ v# V9 }" U* f& `; `: x汉语拼音那么简单的,都没见到OCR全对的呢
  • TA的每日心情
    开心
    2019-5-28 07:39
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2020-9-28 17:41:31 | 显示全部楼层
    本帖最后由 leescott 于 2020-9-28 18:00 编辑
    . _9 S7 k" u% P. n6 `# c6 i9 \( R' s# t
    FineReader和 TESSERACT可能比较好。
    + j2 b/ X, w1 w下面最后有篇文章,用FineReader 。& L* G4 E; J7 ?( ~4 K* a
    https://www.researchgate.net/pos ... honetic_IPA_symbols6 F. l, `# _' l6 W
    文章提到自制语言。我想如果有必要需要自制字体。该字体包括所有符号。2 W' m  `) M' S; _

    , ^/ H- D" c6 `4 A$ P参考https://www.pdawiki.com/forum/fo ... id=41387&extra=
    & q) S, i+ z$ \$ T
  • TA的每日心情

    2022-3-2 15:17
  • 签到天数: 248 天

    [LV.8]以坛为家I

    发表于 2020-9-28 18:03:46 | 显示全部楼层
    OCR的正确率很难提高的,要想尽可能好,需要专门针对音标做一些训练,技术难度不小
  • TA的每日心情
    无聊
    2022-9-25 21:09
  • 签到天数: 1136 天

    [LV.10]以坛为家III

    发表于 2020-9-29 15:46:02 | 显示全部楼层
    如果能用成 reCAPTCHA 的形式,
    " l6 S" L8 p  H登入、下载就识别训练一下,
    $ V. v9 V0 B/ G/ N" Z( X- k3 k这样参与的人就多了。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-4 09:29 , Processed in 0.020905 second(s), 22 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表