掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

楼主: bt4baidu

[词典校勘] 【精校人员募集】World Book Dictionary, 2015 勘误专帖

[复制链接]

该用户从未签到

 楼主| 发表于 2015-11-7 11:57:19 | 显示全部楼层
empenguin20 发表于 2015-11-7 04:05/ i# r! |4 ~/ q( S
鉴于楼上都不严格按照规定数额认领,我也来凑个热闹。认领图片文本化,65至125。
9 U5 R. w0 H, F6 a, g. g我想问下楼主,音标为何 ...
5 `6 U. ]( n, g' K1 n$ a! p
所有修改都有记录,可以慢慢来确认,一次就100%正确不太可能
1 [! P) x, O# V. K/ K9 A, r; H- _
( g: p" i$ Z* S! J% D0 J! b9 ^# h( f  c那个带上横杠的 ė还有i、u̇等,实在是找不到啊。。。6 |: w* B: l, t  D. j& _' q  D; B7 E
0 L" j+ }& L( [, }2 x3 ^+ v
用两个HTML实体字符似乎能勉强拼出来 ė̄=& #x0117;& #x0304;

该用户从未签到

 楼主| 发表于 2015-11-7 12:00:04 | 显示全部楼层
qazqwe 发表于 2015-11-7 11:52  h5 `$ C: J9 J0 ]  _
原本的範例裡面是用ḗ 取代e DOT MACRON, ' Q$ B- }- ~8 ?  b' E3 r7 r
有些是真的找不到, 像是LATIN SMALL LETTER y DOT MACRO ...
. W3 c2 F) ]6 U* h/ O
完工以后可以用HTML实体字符拼
& R+ u: Q. z8 }$ @) z+ c( h' o0 o0 k比如ė̄ = & #x0117;& #x0304;
: i* Z; A8 ]+ x1 X! m2 E) W' \! o$ ?. K1 ]! J
参考别人的写法,保持一致就行,后面可以全文替换

该用户从未签到

 楼主| 发表于 2015-11-7 12:04:21 | 显示全部楼层
dhs1001 发表于 2015-11-7 10:433 c9 p" R2 f0 _0 z. K( C
把9楼empenguin20兄的下载回来看了一下,发现对于ryuya兄所提示需要对照文件名存有一些疑问。
9 Q, ^9 ?5 W/ \从empen ...

" p4 i: V6 i6 p' `能找到对应字符的尽量用对应的字符,实在找不到的,可以先用类似字符代替,后面再想办法
9 s) w$ _2 @7 [' t2 ?

该用户从未签到

 楼主| 发表于 2015-11-7 12:08:08 | 显示全部楼层
mitkyg 发表于 2015-11-7 06:51& E$ E0 ?. E) [% A0 j# u
我又来了# {  n# P5 j  [. m, y" |* l! Z
' v: M- O  s- Q0 o8 w" Z/ \4 u
认领 1、符号or插图: 11条,募集1人
( B* q" e: ~  G+ W
如果能找到所有插图就完美了
5 h' e7 y" m4 {* E. m, y- [6 _. Q  j+ w; M& P, f7 B  B" o4 z' S
只要按词头+.jpg/.png后缀命名,很容易合进去% S5 U* V9 n6 W2 }6 s. w2 U
如果足够清晰,背景为单纯白色,还可以写程序把背景透明化

该用户从未签到

发表于 2015-11-7 12:12:31 | 显示全部楼层
bt4baidu 发表于 2015-11-7 11:57
* {5 L! {) h, C; l5 X2 M& u3 R& P所有修改都有记录,可以慢慢来确认,一次就100%正确不太可能/ o& G! T& b4 _
: f8 W# o. }: c# g( z5 p
那个带上横杠的 ė还有i、u̇等 ...

# O4 ]4 M5 ]  C8 F带橫杠的ē,ī  , ū都是由两个字符(字母本身和UNICODE编码是\u0304这个字符)来表示的

该用户从未签到

 楼主| 发表于 2015-11-7 12:23:38 | 显示全部楼层
tsiank 发表于 2015-11-7 12:12. M1 m, Z2 w, Q3 V2 a
带橫杠的ē,ī  , ū都是由两个字符(字母本身和UNICODE编码是\u0304这个字符)来表示的
, \  p# o) X4 J3 }' ]  R2 Y3 E9 L- d
这种不是,这些都有对应的字符,xls里已经写了
" y2 E7 x5 \1 @2 L带点+横杠的e,i,u找不到,似乎可以用两个HTML实体拼

该用户从未签到

发表于 2015-11-7 12:26:18 | 显示全部楼层
本帖最后由 mitkyg 于 2015-11-7 12:35 编辑 6 e1 q; l  V) w$ m% K0 f
bt4baidu 发表于 2015-11-7 12:08
" b9 y& \" j" r2 C如果能找到所有插图就完美了3 y9 \) T2 k" r' Z9 c: J
8 q% K2 ~3 U- V
只要按词头+.jpg/.png后缀命名,很容易合进去

; ]& F" A+ m+ c5 a; H0 }! @# F1 A$ Q

- h% F9 W& Y( hradical sign 书上是这样的,- Y+ D- l7 h3 b, g' S5 v- N. ]9 \

4 h. d& Q- U4 I9 L2 r. n, u对比wbd的preview版
6 l' a( O9 b0 O, X. w% _' w4 A0 Y, N7 W) ^

' N/ _) M! V5 z! L把“根号16”也截出来替换下?后面也少了= the cube root of 27 = 3.
: n7 r$ S7 Z( h* L4 I* Y$ j0 e& w* c/ x4 N& t: @
再一个fraction- n) U' L! h- q
6 N& B3 p) D' a
书上是这样的0 [$ I+ O' O2 W" w0 T, ?

6 ^/ z% E7 _+ f! @; t 都截出来替换下?
0 q0 t! _3 d) c* B3 F6 }  A& p5 g' W1 h8 g% U) y

" l$ j" v6 `/ n另,图片得一张张截取,2200多页,也不知道有多少张插图,尽快完工吧

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2015-11-7 12:35:24 | 显示全部楼层
贡献两个特殊字母:ǡ ȱ
) F9 W# d; j+ g, m* ~/ A% Xe的那个找没有。。。

该用户从未签到

 楼主| 发表于 2015-11-7 12:46:37 | 显示全部楼层
mitkyg 发表于 2015-11-7 12:26' t) D- Z. F' T% J& K3 X, {
radical sign 书上是这样的,
. E; H) v( E4 u) Z7 ?; Z' @3 i/ T4 L+ G
对比wbd的preview版
- a3 r/ ], Z: _, N# U6 w
书还是PDF?一页一页拍照?那工作量可不小
; ~5 Q' f0 e0 P7 l
" z- m8 A7 U+ j1 @1 T$ t+ w如果是PDF,ABBYY好像在OCR的时候可以自动抠出来的

该用户从未签到

发表于 2015-11-7 13:13:27 | 显示全部楼层
ė̄ ǡ u̇̄ ý̄ ẏ̄ b̆ ȱ b̄ ṇ
7 C( V) m$ s0 k5 _* ]7 w暂时先改了这几个。 希望能有用。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x
  • TA的每日心情
    无聊
    2019-11-17 14:10
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2015-11-7 13:25:21 | 显示全部楼层
    百度兄还有任务吗,我也想加入

    该用户从未签到

    发表于 2015-11-7 13:25:26 | 显示全部楼层
    bt4baidu 发表于 2015-11-7 12:46
    # ?3 S# M# w. M+ p, m4 K书还是PDF?一页一页拍照?那工作量可不小
    ! v* |( Q5 p% f3 I% D3 c
    0 x/ y. w2 A+ k9 H" P如果是PDF,ABBYY好像在OCR的时候可以自动抠出来的

    + i& z; I' N3 u4 W$ h- E# c+ x+ s" vpdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定吧,试截几张,看看图片堪用不
    ( `( f9 r5 v. X
    3 K3 J8 r0 g+ C5 b
    ) b; U: Q" n/ \. Z3 U, ]- R* Y. g" E; u0 Z" r

    4 ]3 R# k5 _+ F6 b$ m& ^% H2 f) f$ Z* e& I1 s2 Q  g* B

    / D5 y0 I3 ~" |" H0 M- v8 f

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    点评

    图片截取后,我来做图片的优化和减小体积。还烦请私信  发表于 2015-11-9 22:30

    该用户从未签到

    发表于 2015-11-7 13:32:01 | 显示全部楼层
    我再领取“链接指向错误”所有2~125,这一项应该还没人领吧

    该用户从未签到

    发表于 2015-11-7 13:39:07 | 显示全部楼层
    qazqwe 发表于 2015-11-7 11:52( e: c- a2 j1 N7 j- N$ {
    原本的範例裡面是用ḗ 取代e DOT MACRON,
    + f3 S  u6 D7 L8 h' G0 }有些是真的找不到, 像是LATIN SMALL LETTER y DOT MACRO ...
    ...ḗ 取代e DOT MACRONḗ 取代e DOT MACRON...

    ' h% @: \7 y5 ?/ h! |* L商榷: 如果实在没有可以办法, 宁可留存图片。
    7 |3 N5 e' K( I* P
    ...y DOT MACRON 還有類似 ȳ́         ȳ̀ 的寫法# c  J9 t5 U( Q8 H9 g
    4 [, y  n3 s: x6 U這要統一做法還是看每個認領的人主觀認定....

    9 n$ w, u: y+ q) d9 V8 G商榷: 不存在主观认定的问题, 一切以原书/PDF内容的客观为准。
    8 X. Z. ?- z; V/ p& Q8 J5 O7 B
  • TA的每日心情
    无聊
    2019-11-17 14:10
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2015-11-7 13:39:07 | 显示全部楼层
    我也想领取“链接指向错误”任务或者“图片文本化”剩下的也可以,百度兄可以吗?

    该用户从未签到

     楼主| 发表于 2015-11-7 13:47:15 | 显示全部楼层
    mitkyg 发表于 2015-11-7 13:25
    ' L2 x( w  F9 |7 ^pdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定 ...
    . L' k  G5 y7 D* x) X3 l
    质量不错啊,辛苦啦4 H! _5 Q9 w4 W- M! A3 i
    既然人工截取,保存的时候记得文件名存为"词头.png",不然就没法一一对应了
    6 S8 p" W' R! c$ n( ]6 D2 k慢慢来,不着急
  • TA的每日心情
    奋斗
    2019-11-16 20:51
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2015-11-7 13:56:34 | 显示全部楼层
    # @) L% t- f  N2 w
    我来做音标文字错乱61-120,请楼主批准!!!

    该用户从未签到

     楼主| 发表于 2015-11-7 14:11:40 | 显示全部楼层
    bsqby 发表于 2015-11-7 13:32
    : |1 \, ?6 B& W( f/ a1 e$ y5 M我再领取“链接指向错误”所有2~125,这一项应该还没人领吧

    6 h; v+ _( c3 _已分配,这个不太好改的

    该用户从未签到

     楼主| 发表于 2015-11-7 14:12:21 | 显示全部楼层
    fuxy526 发表于 2015-11-7 13:39
    9 Q# o, J" q+ e" Q: c我也想领取“链接指向错误”任务或者“图片文本化”剩下的也可以,百度兄可以吗?

    & {% l- e4 |2 N  D' Q+ P3 w图片文本化剩下的都归你了,具体看XLS

    点评

    OK thx  发表于 2015-11-7 14:16

    该用户从未签到

     楼主| 发表于 2015-11-7 14:12:36 | 显示全部楼层
    shakahenryqht 发表于 2015-11-7 13:56
    * r& k( Q7 `; Q我来做音标文字错乱61-120,请楼主批准!!!

    3 q2 r2 r$ b' v* ^+ }, t3 v! LOK

    该用户从未签到

     楼主| 发表于 2015-11-7 14:31:28 | 显示全部楼层
    本帖最后由 bt4baidu 于 2015-11-7 14:33 编辑
    8 h; O: L2 f, S% I% P" X+ z
    mitkyg 发表于 2015-11-7 13:25
    5 d; }4 F% {2 ]# A2 J3 |pdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定 ...
    ! U( M( L$ w% O  u: {8 ^
    8 s9 ^. k6 E, w) |  T/ A# k7 C+ E
    ' L4 d/ u5 }1 Z7 G

    - ~+ m2 R$ M! t9 e9 j( l6 _% d只要使用美图秀秀增强一下对比度,就可以把背景全部去掉

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2015-11-7 14:46:05 | 显示全部楼层
    本帖最后由 mitkyg 于 2015-11-7 14:53 编辑 : |; f- Y8 C$ [9 a; Y
    bt4baidu 发表于 2015-11-7 14:31
    : c# o4 v/ ?4 H5 Y1 x  W7 n1 a只要使用美图秀秀增强一下对比度,就可以把背景全部去掉
    & a+ n  N: R' J0 c4 y% r
    1 z7 N+ ?7 |" g
    好,等图都截完了,我再用美图秀秀处理一下  k4 ^0 d+ H/ J4 _: Y5 p
    # ?  q$ ]2 ]- G
    同时我没有截“星号”,这样显得更美观些
  • TA的每日心情
    慵懒
    2023-2-4 11:26
  • 签到天数: 579 天

    [LV.9]以坛为家II

    发表于 2015-11-7 14:49:46 | 显示全部楼层
    想报名参加,不过以前没做过词典,不知道会不会给你们拖后腿啊??

    该用户从未签到

     楼主| 发表于 2015-11-7 14:58:01 | 显示全部楼层
    mitkyg 发表于 2015-11-7 14:46
    " c4 W9 d) x# i; Y- }好,等图都截完了,我再用美图秀秀处理一下
    ; `) O6 ~  S! C; c, z
    这个工作也可以用python做的,貌似增强对比度+图片去背景都可以用PIL图像处理自动完成; |& Y6 U% b4 q( U4 t
    程序处理不了的再找你8 ~. W3 ^+ l) g$ f  M

    - t6 Q- ?: \" _- q0 e3 z; i最关键的是文件名,这个不能和词头对应起来的话就只有手工了

    点评

    可以再尝试缩小图片体积,这个,到时候我来处理图片吧  发表于 2015-11-9 22:32

    该用户从未签到

    发表于 2015-11-7 15:13:24 | 显示全部楼层
    bt4baidu 发表于 2015-11-7 14:58  R1 Y- q" M  Y7 K
    这个工作也可以用python做的,貌似增强对比度+图片去背景都可以用PIL图像处理自动完成* v# D) r& X/ _
    程序处理不了的再 ...

    8 W* V0 z' M) |, |, {% @: h我刚截了24副图,对比一下,你用工具可以尝试下 2 Y6 U7 a. E1 I& {  c

    ! T( c" g/ I6 z8 O" w; K3 Rhttp://pan.baidu.com/s/1pJ5WYzp
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-24 02:17 , Processed in 0.062615 second(s), 10 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表