掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 5710|回复: 6

[改进建议] 为什么goldendict不开发OCR取词的模块?

[复制链接]

该用户从未签到

发表于 2014-8-26 20:45:29 | 显示全部楼层 |阅读模式
本帖最后由 risenh 于 2014-8-26 20:49 编辑
% w& }, J6 L9 T
! ^! `8 q7 |$ o

网上搜到一个叫mygoldendict的Google Project,程序命名为goldendict-advance,但是里面只剩下开发过程,甚至还留下了用户使用手册,还有各功能模块展示的ppt,但就是没有程序可供下载。。。


, s% x. M) H- j, U' G

ocr取词有道貌似好几年就在用了,金山,必应,海词都有,甚至欧路也有,开源的ocr程序有tesseract,上面那个goldendict-advance的ppt里面介绍就是用的这个tesseract,不知道为什么没有高手再弄一个出来。


- G& k1 R3 _2 u, N- y/ u* n1 C$ ~

可惜完全不会编程什么的,真是有心杀贼无力回天啊,不知道论坛里有没有高手可以造福一下大众?

该用户从未签到

发表于 2014-8-26 22:30:44 | 显示全部楼层

8 A' `3 l) z# |6 l4 h# O
; o! g2 J9 K' Z* ^" c- d4 P! W' ?折腾这玩意儿是个时间的无底洞。GoldenDict胜在多平台、多语种,要顾及多平台、N个语种的OCR识别,需要海量的时间。ABBYY Lingvo x5 也就能 OCR识别二十几个语种,效果还非常一般,这还是背靠自家强大的 Finereader 技术的成果。2 u+ s  H* p% U2 b& j
0 i! e- t, p, n: w8 B9 Y
就算只加上Windows下英语、汉语的OCR识别取词,做到有噵词典那样的,也是市场价格几百万人民币的大活。其它词典软件的OCR取词,基本是噱头,bug一大堆,不堪大用。5 e( c3 e0 X( t" Y

6 }; e' ?1 n% j# c" ]! `造福是有限度的,就跟献血,也只能半年献个几百 cc,要一下子抽个几千,还不得死。
( d9 b$ C$ F2 \# _( p, N! L
/ o" w4 c/ A3 _4 s* K9 u; @7 B有时间的没技术,有技术的没时间和兴趣。
( U/ j- m3 u5 i8 u1 j5 u
4 ~/ |1 z" \  ^只有期待英雄的出现了。
3 U1 Q% Z- U& ]' N2 }6 b$ Z  [4 c" |: k7 x/ C9 C7 E- \

# ]8 G4 B8 t. \6 T9 p7 E0 M. T

该用户从未签到

发表于 2014-8-26 22:33:02 | 显示全部楼层
能让Abs62继续下去已经谢天谢地了!
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-8-26 22:58:57 | 显示全部楼层
    这东西实用性不大。个人觉着有道做得还行,但是也只在电脑上偶尔用用。至于手机上那个摄像头取词,完全鸡肋,晃得眼睛受不了,还不如手输简单。

    该用户从未签到

    发表于 2014-8-27 15:19:29 | 显示全部楼层
    louislaolu 发表于 2014-8-26 22:58
    5 f8 r. ^  @! }' G这东西实用性不大。个人觉着有道做得还行,但是也只在电脑上偶尔用用。至于手机上那个摄像头取词,完全鸡肋 ...
    ( t9 {' U0 q" ?$ J) m! R9 s
    能支持英语外的其他语种还是有点意思的。特别是旅游的时候用,例如让外国人输入中文估计要折腾死他。。。
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-8-27 15:32:53 | 显示全部楼层
    rayman 发表于 2014-8-27 15:19 8 }5 g, I! g6 c( w* o8 R, s
    能支持英语外的其他语种还是有点意思的。特别是旅游的时候用,例如让外国人输入中文估计要折腾死他。。。
    0 ^$ c) a  p3 i3 u
    老大所言极是,这点倒是没有想到。

    该用户从未签到

     楼主| 发表于 2014-8-27 20:40:46 | 显示全部楼层
    Oeasy 发表于 2014-8-26 22:30 : n# f4 ]1 [2 v6 k5 e
    折腾这玩意儿是个时间的无底洞。GoldenDict胜在多平台、多语种,要顾及多平台、N个语种的OCR识别,需要 ...
    4 ?& B+ M0 h! p1 N5 j' `

    2 ?% M/ a+ w" [基础性的东西一向就是苦活累活啊,要是客观的需求动力不足那就更难了,不过,还是觉得这些个多功能的模块肯定还是会慢慢开发齐全出来的,时间早晚的事情,兴许哪天突然一个新的技术就突破让原来的苦累活变得轻松如意,当然前提是词典这东西还继续被人们使用下去
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-3-29 21:26 , Processed in 0.027246 second(s), 9 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表