掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1258|回复: 16

[讨论] 文字版与图片版词典比较

[复制链接]
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

    发表于 2020-2-14 12:26:17 | 显示全部楼层 |阅读模式
    本帖最后由 999阿彌陀佛 于 2020-2-15 10:38 编辑
    & p4 Y; g% S1 J* E! w4 k% [& a, W4 r& j& y6 }, h' W. ~% u6 s1 }
    文字版與圖片版詞典比較2 N, E% E& a9 H* y5 ~% _

    5 C1 D* w3 y  H( O3 i! B文字版:* w% s- t; @9 Y9 A! `
    優點:體積小,可全文檢索。可複製內容。
    " W! c, O6 q  w) K: i  L缺點:錯誤相對多一點。不夠嚴謹。/ F. _$ P. ?# c
    ; h" ^# R) M/ [- [2 J3 o9 n3 }
    圖片版
    % [6 i* u6 @6 W6 L1 a; U優點:相對權威、可靠,準確性更高些。
    ( h3 }2 B; u+ a. \6 p8 y缺點:體積大,不能全文檢索。不能複製內容。
    % n, J% S- D4 I! G  A; v+ J- v5 y4 g- e$ G3 n! \
    我覺得 圖片版辭典 最好做成切圖的,手機能用。整頁的MDX相當於一個能檢索的PDF,手機使用不太方便。當然 檢索比PDF還是方便很多。
    7 j" e* u, v- W0 g/ R/ d) [
    ' c7 s3 P) V  d8 r切圖的,切到單欄,我覺得就可以了,這樣製作難度也不大,可以接受,又保持了閱讀原書的體驗,可以上下比對閱覽。
    . z) b: q9 Z7 B9 y/ I; s4 Z
    8 Q, U' C9 X- T: Z# I切詞的,能做當然也很好,只是工作量太大,製作工期太長。缺點是沒有閱讀原書的體驗,不能上下比對閱覽。
    5 V$ J* P2 E4 m- M' H& S
    / v0 N- P9 g+ Y7 f* J- s1 s$ _- L$ `
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2020-2-15 17:07:35 | 显示全部楼层
    yfz48516 发表于 2020-2-15 02:05$ v( a6 X/ G1 @/ l
    本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全 ...
    . c* o" L  O2 Y7 V( ~
    图片版的MDict词典,特别是没有切图的与扫描版Pdf格式相比,优点:
    # P* U! N+ W/ }7 ^% t6 y

    4 \, z8 J# P' r+ ^  M1、可以同时查询很多词典,包括各种类型的词典,互相引证、对比、借鉴;# w: w. J. o/ n2 o( @7 p
    * l0 n( n3 B; A' N, J. {
    2、使用PDF,需要在使用时一个一个费时打开,容易打断思路;而使用mdx词典,则仅在首次打开词典软件时费点时间(且不说现在几乎是24小时不关机),使用则完全是流畅无摩擦的。
    0 f1 ]/ {7 Q. W, b  ]
    0 [8 t. q$ T, ~
    3、即使是最简单的mdx的
    定位,通常也比扫描版PDF的定位方便快速。: Q, u6 l* X! k: c* {

    . Y% ~0 `: B8 L) p/ n

    . V: t7 {7 z5 E- v# C制作图片版的MDict词典完全不是浪费大神们的宝贵时间,很有意义。

    $ |- x5 D+ P  _" G! X' Q% F3 Z4 F" M2 g6 t- Q5 t

    # A/ ]0 Z. ^  N# B) m* X9 x
    6 J/ S' \/ O+ V6 w6 ?
    1 t+ G# j- {- m0 S7 M4 ~2 }1 N2 s! M4 T
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2020-2-14 12:53:42 | 显示全部楼层
    阿彌陀佛 兄:5 C* O  ?& r; e/ j/ G! I4 w4 ^' m
    圖片單欄 + OCR 文字 並排
    & b" j8 `4 @8 c$ m+ I) D- O/ q
  • TA的每日心情
    擦汗
    2020-1-9 13:35
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2020-2-14 12:54:32 | 显示全部楼层
    個人認為:對於漢語來說,因為有很多字比較繁瑣且不易打出來,自然,識別也很難,所以為了最大可能保證準確,切圖版要比ocr要好些,且工作量不知少多少。其次,如果有現成的網站優先爬取網站。
    . Y6 d) S+ [, j1 M! ?ocr<整頁<切圖<爬網站<現成app
  • TA的每日心情
    擦汗
    2024-2-8 08:54
  • 签到天数: 902 天

    [LV.10]以坛为家III

    发表于 2020-2-14 14:29:09 | 显示全部楼层
    只要制作上乘,一样值得拥有。
  • TA的每日心情
    慵懒
    2020-5-3 16:00
  • 签到天数: 207 天

    [LV.7]常住居民III

    发表于 2020-2-14 16:36:12 | 显示全部楼层
    我觉得,文字版其实也不代表准确性更低吧,更多的还是对于制作人的信任程度吧。切图版的可以很轻易的验证是否被更改出错,文字版就难度更大了。9 V; Z7 J! ~2 j1 |

    0 C8 u  y7 l/ I6 U+ i& Z和willianmson的观点差不多,我觉得词典好坏排序大致如下:
    + ^2 u. d; j9 c( g0 g词典App文字版 / 可靠来源epub或mobi文字版 > 词典网站文字版 > 可靠来源pdf图片版(已校对OCR文字版>切图图片版>整页图片版>未校对OCR文字版)" q; `8 T* }+ ?& M5 _6 ^! Y
    7 P; n& P# {6 \( ?( |
    其实文字版如果准确性能与书本持平的话,更方面好处可以吊打图片版(无论是否切图),个人觉得至少包括一下几点:- S; E% n4 T! B7 j; M- p9 N0 V) K
    1. 文字版可以调整缩进,让阅读更方便
    - m% y8 e# q  G& Q3 P2. 文字版可以添加语音和图片(官方来源更佳),让内容更丰富
    / O* @; Y# U2 k! G3. 文字版可以上色,让阅读更快速抓住重点
    2 r4 U/ k) A6 s* G4. 文字版可以演绎,让后续应用更佳丰富(比如复制节选到笔记)$ H* l- U8 D/ W$ _/ j9 x7 S9 P
    5. 文字版可以自适应屏幕大小排版8 Q  I& M  w& Z- Q2 t. }' W# K
    6. 文字版可以动态折叠,比如隐藏双解的中文,让词典适配不同使用习惯
    9 ?) H/ Y, h; V; a5 s& G* O: I7. 文字版可以全文搜索,让查询多一种选择" p* e" D: U2 u* e
    8. (欢迎持续补充列表)
    2 v+ Y. j& s7 U5 x
  • TA的每日心情
    慵懒
    6 小时前
  • 签到天数: 1718 天

    [LV.Master]伴坛终老

    发表于 2020-2-14 23:43:09 | 显示全部楼层
          关于txt格式的书,很多人有偏见,认为错讹多,质量不及Pdf格式的,但以本人几十年的编辑经验而言,质量与格式没有必然的联系,就算是权威、严谨的图书,例如《辞海》,也无法避免差错(本人也找到过),所以甚至有“无错不成书”的说法,正式出版物的标准是差错率不能超过1/10000。因此对于Txt格式的书来说,质量要具体对待,一本经过认真校对的Txt书,差错可以低于市面上常见的扫描版Pdf书。当然有些通过OCR得到的Txt书,如果没有经过认真校对,肯定错误百出。txt格式的书优点较多:①体积小、存储简单方便,也便于传输交流,不费流量;②格式简单,许多程序都可打开,而且不会像Doc等格式,有可能中病毒;③兼容性好,不管是手机,还是电脑、平板等移动设备;无论Windows,还是苹果等,所有操作系统都可以使用;虽然它有版式简单,显示效果较差,不支持标签记录,不支持图像、音频和视频,不够生动的缺点。
    * s# J( D* [. a/ S& u
  • TA的每日心情
    慵懒
    6 小时前
  • 签到天数: 1718 天

    [LV.Master]伴坛终老

    发表于 2020-2-15 02:05:14 | 显示全部楼层
           本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全文搜索,而且与扫描版Pdf格式那样占存储器空间很大,由此就有一个疑问:图片版的MDict词典,特别是没有切图的与扫描版Pdf格式相比,究竟有何优点?如果没有,那么制作图片版的MDict词典是不是浪费了大神们的宝贵时间,有点得不偿失,不如直接使用扫描版Pdf格式词典?. R: }, B0 I5 b- W: Y; w# p
  • TA的每日心情
    开心
    2019-10-10 05:35
  • 签到天数: 328 天

    [LV.8]以坛为家I

    发表于 2020-2-15 09:48:02 | 显示全部楼层
    C大的切图版已兼顾了切词和整页版的,可任意切换的

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

     楼主| 发表于 2020-2-15 10:39:03 | 显示全部楼层
    yfz48516 发表于 2020-2-14 23:43) L; q3 l' W7 J- P
    关于txt格式的书,很多人有偏见,认为错讹多,质量不及Pdf格式的,但以本人几十年的编辑经验而言,质 ...
    $ L: v% \/ }! V. e. K  n
    校對好的TXT那是最方便了。
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

     楼主| 发表于 2020-2-15 10:40:17 | 显示全部楼层
    yfz48516 发表于 2020-2-15 02:056 L. R7 c! }7 l: Z8 c4 w
    本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全 ...
    ) o0 o* h! U$ d4 w# s" R# o1 f
    圖片詞典檢索比PDF還是要方便很多
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2020-2-15 17:12:34 | 显示全部楼层
    Jiangxi 发表于 2020-2-15 09:48
    $ I4 z' O* O7 T( QC大的切图版已兼顾了切词和整页版的,可任意切换的
    . R/ {: S( f7 a+ c$ b$ U# z; ]
    期待能够开源,以促进进一步改进和维护。说实话,我费劲学了很久,也没用这个办法搞出一本,中间出现问题,也没有供交流、提问的合适地方。
  • TA的每日心情
    开心
    2020-2-28 21:03
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2020-3-2 16:34:19 来自手机 | 显示全部楼层
    johannhuang 发表于 2020-2-14 16:36
    & Q* @" t4 t- p! ~2 o, n. c我觉得,文字版其实也不代表准确性更低吧,更多的还是对于制作人的信任程度吧。切图版的可以很轻易的验证是 ...

    $ }5 p0 }4 @8 c支持,虽然我用的少,最喜欢的就是简繁体转换
  • TA的每日心情

    2019-9-23 23:38
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2020-3-2 16:59:41 | 显示全部楼层
    yfz48516 发表于 2020-2-15 02:05
    ; K( \! Q+ v- O9 [$ K  }$ e本人发现论坛中扫描图片版的MDict词典似乎有增多的趋势,这种词典多数无法像文字版的那样可以进行全 ...

    & Q- a7 D9 n4 i& l; ?* z$ I扫描版PDF除了通读或背诵远比MDX强,查词方面几乎是拙劣到无法忍受。且不说用手机无鼠标的条件下去查找扫描PDF中的某个词多艰难,就是电脑有鼠标的也是奇累无比,至少不如纸质书查得快。

    该用户从未签到

    发表于 2020-3-11 08:23:52 | 显示全部楼层
    十年前,图片词典几乎没人做,也没人用。原因:) S  k) F2 a# r; ?  X
    1 在词典制作风行之初,文本数据相对较多
    * a. a& S/ G! Z9 G- p2 手机内存运存屏幕都小,图片词典装不下,打不开,看不了8 u& |2 ~3 S7 U+ c" I5 E
    现在图片词典渐多,原因:
    0 E3 Y1 a4 {: s* p2 u" Y1 文本数据挖掘殆尽5 l! R6 W9 o! L. \) W
    2 电子终端越来越先进$ }- q+ S$ |/ H; w
    3 图片版制作技术越来越成熟,像佛大的切图版,像c大的切片版0 y$ S# _0 ?4 X3 c& [/ R
    4 大家对词典的需求越来越多样
    ( w; {# t$ o# U. O( s! K9 p( O" O& Y) y& w
    就词典而言,我觉得全文搜索意义不大,图片版基本可以满足大众需求。只不过除了c大的精准切片,不足之处就是还得在图片中找词条,尤其是整页版,如能在图片上加锚好了。
    6 t8 M2 I7 ^& K$ K/ W4 P/ e当然,可靠文本最好,退而求其次,图片版也很ok。
  • TA的每日心情
    擦汗
    2020-7-3 13:51
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2020-8-10 03:02:42 | 显示全部楼层
    图片版词典并不是一无是处。它可以查看前后相关词(主要是同根词),对扩大词汇量有巨大的好处,这是文字版词典无法比拟的重大优点。而且扫描版的词典来源比文字版的多了好几个数量级了,对扫描版词典做粗略匹配的图片版MDX是最容易的,可以迅速增加手中的MDX词典拥有量。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-23 14:10 , Processed in 0.075418 second(s), 9 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表