掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 5771|回复: 6

[改进建议] 为什么goldendict不开发OCR取词的模块?

[复制链接]

该用户从未签到

发表于 2014-8-26 20:45:29 | 显示全部楼层 |阅读模式
本帖最后由 risenh 于 2014-8-26 20:49 编辑 ) i* u: X) ], `5 w5 P: o

; o( @& C  G" b* B( X  G/ o* H

网上搜到一个叫mygoldendict的Google Project,程序命名为goldendict-advance,但是里面只剩下开发过程,甚至还留下了用户使用手册,还有各功能模块展示的ppt,但就是没有程序可供下载。。。

  S. J, m# N+ V5 C9 y. j5 f0 l

ocr取词有道貌似好几年就在用了,金山,必应,海词都有,甚至欧路也有,开源的ocr程序有tesseract,上面那个goldendict-advance的ppt里面介绍就是用的这个tesseract,不知道为什么没有高手再弄一个出来。

: a. W4 n2 ?* N7 a  |

可惜完全不会编程什么的,真是有心杀贼无力回天啊,不知道论坛里有没有高手可以造福一下大众?

该用户从未签到

发表于 2014-8-26 22:30:44 | 显示全部楼层
; R( }: M, p# c" o. ^
: C/ D6 W+ \# X; \
折腾这玩意儿是个时间的无底洞。GoldenDict胜在多平台、多语种,要顾及多平台、N个语种的OCR识别,需要海量的时间。ABBYY Lingvo x5 也就能 OCR识别二十几个语种,效果还非常一般,这还是背靠自家强大的 Finereader 技术的成果。
( g1 X" I; n# `9 l* N: @9 C  z+ N3 `. }, v* z
就算只加上Windows下英语、汉语的OCR识别取词,做到有噵词典那样的,也是市场价格几百万人民币的大活。其它词典软件的OCR取词,基本是噱头,bug一大堆,不堪大用。
0 |' ^, D3 `2 b
( @! r6 F, d% w造福是有限度的,就跟献血,也只能半年献个几百 cc,要一下子抽个几千,还不得死。% x( a3 O( Q7 i' |4 Z6 d! m4 q
* J& g& s! q, o: C
有时间的没技术,有技术的没时间和兴趣。- G2 [7 i. J5 U  |- f( D
) _9 x/ A0 s3 ?# A4 e( J, D
只有期待英雄的出现了。, }( g; l8 _7 S$ u
6 G1 P) T9 R0 i# k5 b6 B2 n# M
- j) k1 l$ ?7 e6 n* I2 H# c8 {

该用户从未签到

发表于 2014-8-26 22:33:02 | 显示全部楼层
能让Abs62继续下去已经谢天谢地了!
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-8-26 22:58:57 | 显示全部楼层
    这东西实用性不大。个人觉着有道做得还行,但是也只在电脑上偶尔用用。至于手机上那个摄像头取词,完全鸡肋,晃得眼睛受不了,还不如手输简单。

    该用户从未签到

    发表于 2014-8-27 15:19:29 | 显示全部楼层
    louislaolu 发表于 2014-8-26 22:58
    ) i$ L2 J& i# X# A# J4 M2 h: @9 H7 X6 n这东西实用性不大。个人觉着有道做得还行,但是也只在电脑上偶尔用用。至于手机上那个摄像头取词,完全鸡肋 ...

    : N9 E1 E9 K4 m$ i1 J: D4 b1 k能支持英语外的其他语种还是有点意思的。特别是旅游的时候用,例如让外国人输入中文估计要折腾死他。。。
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-8-27 15:32:53 | 显示全部楼层
    rayman 发表于 2014-8-27 15:19
    % u( Y4 _  R3 E5 E能支持英语外的其他语种还是有点意思的。特别是旅游的时候用,例如让外国人输入中文估计要折腾死他。。。
    5 R' n# ^. ?& h* O, [& |/ l
    老大所言极是,这点倒是没有想到。

    该用户从未签到

     楼主| 发表于 2014-8-27 20:40:46 | 显示全部楼层
    Oeasy 发表于 2014-8-26 22:30 0 ?- l2 L; I- d3 {; `
    折腾这玩意儿是个时间的无底洞。GoldenDict胜在多平台、多语种,要顾及多平台、N个语种的OCR识别,需要 ...
      G; m, w* Y1 A7 P

    5 C/ N" f& G; X  s基础性的东西一向就是苦活累活啊,要是客观的需求动力不足那就更难了,不过,还是觉得这些个多功能的模块肯定还是会慢慢开发齐全出来的,时间早晚的事情,兴许哪天突然一个新的技术就突破让原来的苦累活变得轻松如意,当然前提是词典这东西还继续被人们使用下去
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-29 19:59 , Processed in 0.049176 second(s), 8 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表