掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 788|回复: 6

[求助] 如何正确地OCR识别出音标避免乱码?

[复制链接]
  • TA的每日心情
    擦汗
    2020-7-3 13:51
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2020-9-28 16:57:24 | 显示全部楼层 |阅读模式
    用ACROBAT自带的OCR处理词典页面,发现音标识别出来绝大部分都有乱码。不知道如何解决?

    该用户从未签到

    发表于 2020-9-28 19:13:06 | 显示全部楼层
    本帖最后由 klwo2 于 2020-9-28 19:24 编辑
    2 V9 b% v6 F( |( z# M4 _3 B; o
    leescott 发表于 2020-9-28 17:41
    , P- n) _$ }2 u! Z6 Z0 aFineReader和 TESSERACT可能比较好。
    ( Z( Q- }$ i* T; Z5 C9 X下面最后有篇文章,用FineReader 。
    $ I6 L3 D( W. Chttps://www.researchgate.net/po ...

    8 c8 Q) b2 D/ z& {  l1 g: u理论上,FineReader可以自制语言,把IPA包进来就行了。可是实际效果不行:
    1 @) z5 \% G8 G3 Y6 s$ C
    $ d8 w2 H% F" x
    6 E0 ~9 i* t% \; p. _" S. W' T5 a6 a, m8 U8 l: _  o3 `
    试了多个配置,/ʃəs/ 就是不能识别,/ʃəs/ 有多常见大家都知道
    , n: }! f; y# e7 l) x
    % D+ {5 ~% O! G# Q! A& |! f9 r更何况楼主想要的,估计是中文也准、英文也准,最好音标还不出错,有这么美的事儿,英汉词典早就大跃进变文字版了
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2020-9-28 17:10:11 | 显示全部楼层
    starmars 兄,你這不是多問的嗎?,英文字母都不一定正確了,更何況是音標呢!

    该用户从未签到

    发表于 2020-9-28 17:20:56 | 显示全部楼层
    解决不了
    9 @$ d  m& f# m; J( e" R
    # [6 B: z5 o  c* K' M3 B/ ]英语词典里的【国际音标】,其实只是国际音标的子集。下面这些,也是国际音标:
    . o5 u5 U/ e& A# J8 [( x% s3 x7 j9 c" N

    - L7 A  ]( u; o' F: g
    + A/ J2 M) b: w! V8 W$ K又有帽子又有尾巴. V6 m1 [4 E! J# `6 K  L" i

    3 P, }) K2 _9 W9 T汉语拼音那么简单的,都没见到OCR全对的呢
  • TA的每日心情
    开心
    2019-5-28 07:39
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2020-9-28 17:41:31 | 显示全部楼层
    本帖最后由 leescott 于 2020-9-28 18:00 编辑
      P: V6 Q% j, D, q- a, t" ]8 O2 ]
    ! d1 c/ j  J$ L- j% u$ L; AFineReader和 TESSERACT可能比较好。
    : \% S# U9 G8 M( i下面最后有篇文章,用FineReader 。
    $ v7 N" x8 r# U" y. lhttps://www.researchgate.net/pos ... honetic_IPA_symbols
    - G/ d6 w5 s# L9 X: ]文章提到自制语言。我想如果有必要需要自制字体。该字体包括所有符号。* F' C2 d5 z- N7 h6 A

    / A+ u1 a- _5 ~# u/ V参考https://www.pdawiki.com/forum/fo ... id=41387&extra=5 m7 h" A$ r& p& |- }+ L- Y
  • TA的每日心情

    2022-3-2 15:17
  • 签到天数: 248 天

    [LV.8]以坛为家I

    发表于 2020-9-28 18:03:46 | 显示全部楼层
    OCR的正确率很难提高的,要想尽可能好,需要专门针对音标做一些训练,技术难度不小
  • TA的每日心情
    无聊
    2022-9-25 21:09
  • 签到天数: 1136 天

    [LV.10]以坛为家III

    发表于 2020-9-29 15:46:02 | 显示全部楼层
    如果能用成 reCAPTCHA 的形式,; q% C' Z7 v6 `3 R
    登入、下载就识别训练一下,  }0 I* l+ n! I) A) Q( h# T
    这样参与的人就多了。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-26 15:13 , Processed in 0.047796 second(s), 10 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表