掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 468|回复: 16

[讨论] 文字版与图片版词典比较

[复制链接]
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

    发表于 2020-2-14 12:26:17 | 显示全部楼层 |阅读模式
    本帖最后由 999阿彌陀佛 于 2020-2-15 10:38 编辑 : @. I' i2 [' }- T5 M9 ^
    : K# M, ~" }* }, _) p, ~
    文字版與圖片版詞典比較
    $ v4 Y# x( U7 _: ~4 r$ p
    9 Y0 m7 I" S+ S' w, p文字版:9 ^" v( \3 p: z
    優點:體積小,可全文檢索。可複製內容。4 c5 j" o6 D5 g3 F! d3 d4 b0 \
    缺點:錯誤相對多一點。不夠嚴謹。
    3 f$ v- Y  Y. r: A% i' r
    $ ?' z! h/ |+ W# ?圖片版* ?6 `  u- P+ a' @
    優點:相對權威、可靠,準確性更高些。2 U4 i7 M& z+ o2 v- J% J% U: A
    缺點:體積大,不能全文檢索。不能複製內容。6 M0 n0 ?$ R$ S2 |. I5 \
    ! ]: _1 _: s" l) O% o. ]/ }
    我覺得 圖片版辭典 最好做成切圖的,手機能用。整頁的MDX相當於一個能檢索的PDF,手機使用不太方便。當然 檢索比PDF還是方便很多。% z  I, p9 \  y- j* D4 N6 e
    9 J5 x# P* ]* Y# p
    切圖的,切到單欄,我覺得就可以了,這樣製作難度也不大,可以接受,又保持了閱讀原書的體驗,可以上下比對閱覽。2 g9 Y8 Y$ v; V" x( O6 p
    / H) m2 J/ R4 R
    切詞的,能做當然也很好,只是工作量太大,製作工期太長。缺點是沒有閱讀原書的體驗,不能上下比對閱覽。
    6 Z3 Q5 C2 S- s* f( L1 a3 P9 l) ~# r+ b4 k& a0 c; A2 f2 X6 _( Z
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2020-2-14 12:53:42 | 显示全部楼层
    阿彌陀佛 兄:
    : \9 M6 h: q$ q( P9 j( z  a! B$ R圖片單欄 + OCR 文字 並排5 @8 {- E# z  v; t+ J
  • TA的每日心情
    擦汗
    2020-1-9 13:35
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2020-2-14 12:54:32 | 显示全部楼层
    個人認為:對於漢語來說,因為有很多字比較繁瑣且不易打出來,自然,識別也很難,所以為了最大可能保證準確,切圖版要比ocr要好些,且工作量不知少多少。其次,如果有現成的網站優先爬取網站。
    1 E1 W+ o4 V2 m0 v( L1 K: j% Mocr<整頁<切圖<爬網站<現成app
  • TA的每日心情
    慵懒
    昨天 08:17
  • 签到天数: 435 天

    [LV.9]以坛为家II

    发表于 2020-2-14 14:29:09 | 显示全部楼层
    只要制作上乘,一样值得拥有。
  • TA的每日心情
    慵懒
    2020-5-3 16:00
  • 签到天数: 207 天

    [LV.7]常住居民III

    发表于 2020-2-14 16:36:12 | 显示全部楼层
    我觉得,文字版其实也不代表准确性更低吧,更多的还是对于制作人的信任程度吧。切图版的可以很轻易的验证是否被更改出错,文字版就难度更大了。) c- H& @5 ?/ m2 ^- g
    4 [1 ]1 X9 q: I& w2 \! @' v
    和willianmson的观点差不多,我觉得词典好坏排序大致如下:
    4 p# {( T) a3 X  e' {1 C" \4 K6 C词典App文字版 / 可靠来源epub或mobi文字版 > 词典网站文字版 > 可靠来源pdf图片版(已校对OCR文字版>切图图片版>整页图片版>未校对OCR文字版)# d' h' J% R6 D; b2 p' w( ?3 d6 S1 T$ I
    5 P5 \9 F& c0 a9 ~' B
    其实文字版如果准确性能与书本持平的话,更方面好处可以吊打图片版(无论是否切图),个人觉得至少包括一下几点:% @( u3 I. O/ v- {" Q& A, L
    1. 文字版可以调整缩进,让阅读更方便
    & m  p  P7 w) d6 @: E7 I) J2. 文字版可以添加语音和图片(官方来源更佳),让内容更丰富
    5 K6 |* m5 g( y* d3. 文字版可以上色,让阅读更快速抓住重点
    8 V; p  X  X: o8 \4. 文字版可以演绎,让后续应用更佳丰富(比如复制节选到笔记)
    " w8 w( f& `! O5. 文字版可以自适应屏幕大小排版
    : d9 `* ^& e5 _6. 文字版可以动态折叠,比如隐藏双解的中文,让词典适配不同使用习惯
    & H& f) m- V, K7. 文字版可以全文搜索,让查询多一种选择
    & ^! e* v1 d8 N0 g# _1 D8. (欢迎持续补充列表)+ x* O9 Z% F+ a  Z* Z1 \1 V
  • TA的每日心情
    慵懒
    4 小时前
  • 签到天数: 413 天

    [LV.9]以坛为家II

    发表于 2020-2-14 23:43:09 | 显示全部楼层
          关于txt格式的书,很多人有偏见,认为错讹多,质量不及Pdf格式的,但以本人几十年的编辑经验而言,质量与格式没有必然的联系,就算是权威、严谨的图书,例如《辞海》,也无法避免差错(本人也找到过),所以甚至有“无错不成书”的说法,正式出版物的标准是差错率不能超过1/10000。因此对于Txt格式的书来说,质量要具体对待,一本经过认真校对的Txt书,差错可以低于市面上常见的扫描版Pdf书。当然有些通过OCR得到的Txt书,如果没有经过认真校对,肯定错误百出。txt格式的书优点较多:①体积小、存储简单方便,也便于传输交流,不费流量;②格式简单,许多程序都可打开,而且不会像Doc等格式,有可能中病毒;③兼容性好,不管是手机,还是电脑、平板等移动设备;无论Windows,还是苹果等,所有操作系统都可以使用;虽然它有版式简单,显示效果较差,不支持标签记录,不支持图像、音频和视频,不够生动的缺点。
      r" A# W' C3 e) ]; \& [$ c
  • TA的每日心情
    慵懒
    4 小时前
  • 签到天数: 413 天

    [LV.9]以坛为家II

    发表于 2020-2-15 02:05:14 | 显示全部楼层
           本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全文搜索,而且与扫描版Pdf格式那样占存储器空间很大,由此就有一个疑问:图片版的MDict词典,特别是没有切图的与扫描版Pdf格式相比,究竟有何优点?如果没有,那么制作图片版的MDict词典是不是浪费了大神们的宝贵时间,有点得不偿失,不如直接使用扫描版Pdf格式词典?
    # S3 T% H; D- L6 C" H9 R. p
  • TA的每日心情
    开心
    2019-10-10 05:35
  • 签到天数: 328 天

    [LV.8]以坛为家I

    发表于 2020-2-15 09:48:02 | 显示全部楼层
    C大的切图版已兼顾了切词和整页版的,可任意切换的

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?免费注册

    x
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

     楼主| 发表于 2020-2-15 10:39:03 | 显示全部楼层
    yfz48516 发表于 2020-2-14 23:43
    3 P3 F$ h7 d. B  h关于txt格式的书,很多人有偏见,认为错讹多,质量不及Pdf格式的,但以本人几十年的编辑经验而言,质 ...
    1 P+ I5 i4 l  o% v& {6 n
    校對好的TXT那是最方便了。
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

     楼主| 发表于 2020-2-15 10:40:17 | 显示全部楼层
    yfz48516 发表于 2020-2-15 02:059 z3 S0 ~7 b# H" j! g5 S
    本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全 ...

    9 j% Y- ^# [- \; V3 U1 X6 |3 a圖片詞典檢索比PDF還是要方便很多
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2020-2-15 17:07:35 | 显示全部楼层
    yfz48516 发表于 2020-2-15 02:05
    + p' G- }$ _8 q6 C8 l本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全 ...
    3 `1 s# G5 R; q/ b; V1 d
    图片版的MDict词典,特别是没有切图的与扫描版Pdf格式相比,优点:' y. a, Z% Q" A! D
    ! f/ V3 Y- Z6 m% X
    1、可以同时查询很多词典,包括各种类型的词典,互相引证、对比、借鉴;1 F& d7 J) s+ o, [5 M" h9 C

    ( n$ P' H& h: r5 s" Y2、使用PDF,需要在使用时一个一个费时打开,容易打断思路;而使用mdx词典,则仅在首次打开词典软件时费点时间(且不说现在几乎是24小时不关机),使用则完全是流畅无摩擦的。
    ' p2 W3 s* ?$ D6 w* }

    5 a  _% s* N+ E2 _3 x5 ~3、即使是最简单的mdx的
    定位,通常也比扫描版PDF的定位方便快速。
    : c* Q* e( B6 ?7 `( f
    7 d- q4 x4 Q. k6 e& r2 Q7 C9 k% ]6 ?
    1 D5 Z  B$ V- f7 P+ t8 z
    制作图片版的MDict词典完全不是浪费大神们的宝贵时间,很有意义。
    - y: N: n( p2 L! K! K+ g$ u
    4 q: j( }$ E9 B2 e
    2 c+ C4 D( n4 M+ I$ k
    ) R- B: c# c! j

    8 X! N* e" W1 K* X7 H
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2020-2-15 17:12:34 | 显示全部楼层
    Jiangxi 发表于 2020-2-15 09:488 ^( S; \: I$ B+ q- Y5 V0 b9 i' Z
    C大的切图版已兼顾了切词和整页版的,可任意切换的
    ( b+ N: v6 M  Z! H
    期待能够开源,以促进进一步改进和维护。说实话,我费劲学了很久,也没用这个办法搞出一本,中间出现问题,也没有供交流、提问的合适地方。
  • TA的每日心情
    开心
    2020-2-28 21:03
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2020-3-2 16:34:19 来自手机 | 显示全部楼层
    johannhuang 发表于 2020-2-14 16:36
    7 \! S4 K/ R- P0 o( A6 w我觉得,文字版其实也不代表准确性更低吧,更多的还是对于制作人的信任程度吧。切图版的可以很轻易的验证是 ...

    5 v: H7 P% h* h3 v  X5 V支持,虽然我用的少,最喜欢的就是简繁体转换
  • TA的每日心情

    2019-9-23 23:38
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2020-3-2 16:59:41 | 显示全部楼层
    yfz48516 发表于 2020-2-15 02:05
    - P% u& K3 C& Y4 X. m: H本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全 ...
    $ U3 L" B5 c  v* N9 B, W
    扫描版PDF除了通读或背诵远比MDX强,查词方面几乎是拙劣到无法忍受。且不说用手机无鼠标的条件下去查找扫描PDF中的某个词多艰难,就是电脑有鼠标的也是奇累无比,至少不如纸质书查得快。

    该用户从未签到

    发表于 2020-3-11 08:23:52 | 显示全部楼层
    十年前,图片词典几乎没人做,也没人用。原因:
    2 h& \0 @4 Z# {6 Q1 在词典制作风行之初,文本数据相对较多$ r6 O" J3 ]* T% ?
    2 手机内存运存屏幕都小,图片词典装不下,打不开,看不了/ z- w* X/ z( H7 Q
    现在图片词典渐多,原因:5 {6 Q  M2 M9 }& V3 W# B, h4 ^' ?
    1 文本数据挖掘殆尽! A2 k! }/ _! h+ k
    2 电子终端越来越先进1 e- p# a" T" X1 }' ~# }) d% G
    3 图片版制作技术越来越成熟,像佛大的切图版,像c大的切片版
    ; |* W6 }9 ?5 R/ s! E4 大家对词典的需求越来越多样% p4 y- O0 S! l- q0 Y7 O

    ' Y* J9 K; G) U; ]6 g% J0 |就词典而言,我觉得全文搜索意义不大,图片版基本可以满足大众需求。只不过除了c大的精准切片,不足之处就是还得在图片中找词条,尤其是整页版,如能在图片上加锚好了。! f; T8 v5 r3 S2 f: U# a& Q
    当然,可靠文本最好,退而求其次,图片版也很ok。
  • TA的每日心情
    擦汗
    2020-7-3 13:51
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 前天 03:02 | 显示全部楼层
    图片版词典并不是一无是处。它可以查看前后相关词(主要是同根词),对扩大词汇量有巨大的好处,这是文字版词典无法比拟的重大优点。而且扫描版的词典来源比文字版的多了好几个数量级了,对扫描版词典做粗略匹配的图片版MDX是最容易的,可以迅速增加手中的MDX词典拥有量。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    顶部qrcode底部
    关注公众号送论坛充值码
    关注微信公众平台
    关注微信公众号 pdawiki,获取邀请码,看文抢积分,抽奖得浮云! Follow our Wechat official account "pdawiki", get invitation codes, and play the lottery to earn points (积分)!

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2020-8-12 05:04 , Processed in 0.041880 second(s), 6 queries , MemCache On.

    Powered by Discuz! X3.4

    © 2001-2017 Comsenz Inc.

    快速回复 返回顶部 返回列表