|
本帖最后由 Oeasy 于 2017-5-2 09:17 编辑
( ?' K4 s7 ]: ]: }' c! ?6 v
3 }* o8 S$ G9 g7 k6 R& @
& R1 H- \9 E5 Y. ^' D隔行如隔山。很多新接触词典的朋友,对于一些“业内”、“行内”的常识不是很熟悉,这是可以理解的,我有时间就简单写几句,科普一下。8 w4 D0 [" m/ [- B6 E
不是很严谨,欢迎补充。; p, L3 s" K% d
2 c8 ~6 Y$ l6 e: a+ O[冷知识]扫描版PDF做不了mdx) W6 }- V' V1 E" p
-> [冷知识]扫描版PDF几乎做不了文字mdx
0 |3 d) C9 z; f4 \! t7 D
5 n8 \1 G) n# N% U9 t经常有朋友公开发帖或者私下来信,“我有某词典PDF,还是高清的噢,你能帮我做成mdx吗”。8 @' E' {+ i3 L0 T* J" v; S7 w
eg. [讨论] 提供OCR的日语国语大辞典第二版PDF,有人愿意做MDX文件吗 http://bbs.gxsd.com.cn/forum.php?mod=viewthread&tid=991790
% @4 {; r1 p- }1 F. T- U, G+ a/ K6 p- x- T4 [9 Z% C
- 首先,你能公开找到的 PDF ,其他人也能找到,说不定你那个 PDF 还是他分享出去的呢。当然班门弄斧、野人献曝的事情,我也经常干的。6 a* e4 B+ D7 X3 j, Q
- 其次,扫描版的 PDF ,是几乎做不了文字版的 mdx 的。OCR效果差,校对耗费时间太多。% M, W& g/ c3 t+ u% H0 L+ b
- 再则,要做图片版的话,耗费时间也很多,我自己是不做了。+ e5 o& C2 l3 h4 l w
- 加一句,就算是文字版的 PDF ,做 mdx 也不容易。& { T7 Q2 u( N7 N; u( {. P+ {
4 |' v8 ^0 k5 M: V$ [! s0 a[冷知识]mdx 词典不是人工录入或OCR的 https://pdawiki.com/forum/thread-20643-1-1.html4 _, A0 A% l1 S. i9 y
& k) z: u1 P9 V7 @5 q
|
|