掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 5772|回复: 6

[改进建议] 为什么goldendict不开发OCR取词的模块?

[复制链接]

该用户从未签到

发表于 2014-8-26 20:45:29 | 显示全部楼层 |阅读模式
本帖最后由 risenh 于 2014-8-26 20:49 编辑 % S' I) H3 n  j5 H; T: J

% w9 L9 ~* G6 }

网上搜到一个叫mygoldendict的Google Project,程序命名为goldendict-advance,但是里面只剩下开发过程,甚至还留下了用户使用手册,还有各功能模块展示的ppt,但就是没有程序可供下载。。。


0 n( N! w4 w. Q+ C+ \( y7 x

ocr取词有道貌似好几年就在用了,金山,必应,海词都有,甚至欧路也有,开源的ocr程序有tesseract,上面那个goldendict-advance的ppt里面介绍就是用的这个tesseract,不知道为什么没有高手再弄一个出来。


3 b0 U) q, }1 q: t4 k

可惜完全不会编程什么的,真是有心杀贼无力回天啊,不知道论坛里有没有高手可以造福一下大众?

该用户从未签到

发表于 2014-8-26 22:30:44 | 显示全部楼层

/ W8 }4 T( b  O- H9 |/ Q" i8 j
2 v4 j% V7 e: v5 C: z折腾这玩意儿是个时间的无底洞。GoldenDict胜在多平台、多语种,要顾及多平台、N个语种的OCR识别,需要海量的时间。ABBYY Lingvo x5 也就能 OCR识别二十几个语种,效果还非常一般,这还是背靠自家强大的 Finereader 技术的成果。7 R" v& G& o/ q/ C

& N0 K' _% l  y; i5 y2 L) ~就算只加上Windows下英语、汉语的OCR识别取词,做到有噵词典那样的,也是市场价格几百万人民币的大活。其它词典软件的OCR取词,基本是噱头,bug一大堆,不堪大用。
8 J" v3 N9 p: S6 h: K
% r5 _" V' H+ Y" Y. o; D5 I7 l造福是有限度的,就跟献血,也只能半年献个几百 cc,要一下子抽个几千,还不得死。
9 i+ v7 `  {0 \2 M5 L, Y8 f/ q$ J- q6 o$ B) s3 J
有时间的没技术,有技术的没时间和兴趣。' w0 _7 Z2 @$ F% W
1 a8 O" U) Y* m- @
只有期待英雄的出现了。
) p% I" o+ ]/ }& l) B
- I* T9 c$ m/ y6 w4 k8 g# y% R. @; |$ `! {; @. `6 K7 G4 i8 p' }; P

该用户从未签到

发表于 2014-8-26 22:33:02 | 显示全部楼层
能让Abs62继续下去已经谢天谢地了!
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-8-26 22:58:57 | 显示全部楼层
    这东西实用性不大。个人觉着有道做得还行,但是也只在电脑上偶尔用用。至于手机上那个摄像头取词,完全鸡肋,晃得眼睛受不了,还不如手输简单。

    该用户从未签到

    发表于 2014-8-27 15:19:29 | 显示全部楼层
    louislaolu 发表于 2014-8-26 22:58 5 i! _8 P3 D0 C' @5 q0 N$ g3 d+ p# S
    这东西实用性不大。个人觉着有道做得还行,但是也只在电脑上偶尔用用。至于手机上那个摄像头取词,完全鸡肋 ...

    - t& f7 [8 t# d( m. F; R能支持英语外的其他语种还是有点意思的。特别是旅游的时候用,例如让外国人输入中文估计要折腾死他。。。
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-8-27 15:32:53 | 显示全部楼层
    rayman 发表于 2014-8-27 15:19 % b( H6 L7 C' ^8 D. `5 q5 F
    能支持英语外的其他语种还是有点意思的。特别是旅游的时候用,例如让外国人输入中文估计要折腾死他。。。
    9 y# v- W+ y8 g; u9 }$ j4 }
    老大所言极是,这点倒是没有想到。

    该用户从未签到

     楼主| 发表于 2014-8-27 20:40:46 | 显示全部楼层
    Oeasy 发表于 2014-8-26 22:30
    / \& Q/ P: s: V5 B4 {6 l折腾这玩意儿是个时间的无底洞。GoldenDict胜在多平台、多语种,要顾及多平台、N个语种的OCR识别,需要 ...

    # l* A4 G& S3 y# \7 X, v7 s3 a
    基础性的东西一向就是苦活累活啊,要是客观的需求动力不足那就更难了,不过,还是觉得这些个多功能的模块肯定还是会慢慢开发齐全出来的,时间早晚的事情,兴许哪天突然一个新的技术就突破让原来的苦累活变得轻松如意,当然前提是词典这东西还继续被人们使用下去
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-29 21:02 , Processed in 0.075068 second(s), 8 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表