掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

楼主: bt4baidu

[词典校勘] 【精校人员募集】World Book Dictionary, 2015 勘误专帖

[复制链接]

该用户从未签到

 楼主| 发表于 2015-11-7 11:57:19 | 显示全部楼层
empenguin20 发表于 2015-11-7 04:054 a4 g0 t8 p( a; b6 g
鉴于楼上都不严格按照规定数额认领,我也来凑个热闹。认领图片文本化,65至125。  t; R& g, J5 }9 S( g9 n
我想问下楼主,音标为何 ...

3 A  `- Q4 j# c所有修改都有记录,可以慢慢来确认,一次就100%正确不太可能! }& y5 E4 ]7 r( _5 e' ]

9 i" x5 t6 c' `' Z5 X. A那个带上横杠的 ė还有i、u̇等,实在是找不到啊。。。
) X. m; t5 A, A7 E
4 G( \, L, i. J9 B. X; A" V. a用两个HTML实体字符似乎能勉强拼出来 ė̄=& #x0117;& #x0304;

该用户从未签到

 楼主| 发表于 2015-11-7 12:00:04 | 显示全部楼层
qazqwe 发表于 2015-11-7 11:52
  p  O1 Y$ r& ?% R& ~原本的範例裡面是用ḗ 取代e DOT MACRON,
$ |' B8 n$ ?4 v' ]: w  v$ }有些是真的找不到, 像是LATIN SMALL LETTER y DOT MACRO ...
, z( D4 L3 ]1 @% p+ _6 y  k' m: k7 \
完工以后可以用HTML实体字符拼7 o! ]. k+ V7 Z' P0 Y- _0 T
比如ė̄ = & #x0117;& #x0304;$ d- \+ ]6 O; p$ J) k6 Q
% q. y( Z) X# \; K" o
参考别人的写法,保持一致就行,后面可以全文替换

该用户从未签到

 楼主| 发表于 2015-11-7 12:04:21 | 显示全部楼层
dhs1001 发表于 2015-11-7 10:431 a$ |! n4 p# t
把9楼empenguin20兄的下载回来看了一下,发现对于ryuya兄所提示需要对照文件名存有一些疑问。6 K  v: ]8 \$ [
从empen ...
+ x+ T0 L. B5 \4 Q/ b: x% |
能找到对应字符的尽量用对应的字符,实在找不到的,可以先用类似字符代替,后面再想办法
7 E  U( F- `+ U; z; ], T

该用户从未签到

 楼主| 发表于 2015-11-7 12:08:08 | 显示全部楼层
mitkyg 发表于 2015-11-7 06:51
8 U0 E) [7 x3 J% H我又来了
* m9 ~# [6 K. o! p  S' N, U/ r. K3 f( a9 H' M
认领 1、符号or插图: 11条,募集1人
+ _: V  |' R) b, |4 \# x4 T  z5 g
如果能找到所有插图就完美了
6 U& b/ \+ S% f$ g3 N
8 ~! o: Q/ [) c% o: }1 ]5 a+ Y只要按词头+.jpg/.png后缀命名,很容易合进去
/ t% J% r6 B6 ?; n如果足够清晰,背景为单纯白色,还可以写程序把背景透明化

该用户从未签到

发表于 2015-11-7 12:12:31 | 显示全部楼层
bt4baidu 发表于 2015-11-7 11:57
( Q5 W" E+ O- r! F& T所有修改都有记录,可以慢慢来确认,一次就100%正确不太可能
* u# N0 b9 {; H/ j4 o1 ]
# q9 _0 W, \. l( j  W! E那个带上横杠的 ė还有i、u̇等 ...
# Z! X7 ~% S6 U
带橫杠的ē,ī  , ū都是由两个字符(字母本身和UNICODE编码是\u0304这个字符)来表示的

该用户从未签到

 楼主| 发表于 2015-11-7 12:23:38 | 显示全部楼层
tsiank 发表于 2015-11-7 12:12
( ]7 T! ]7 }4 A# W0 Z0 |带橫杠的ē,ī  , ū都是由两个字符(字母本身和UNICODE编码是\u0304这个字符)来表示的
! T3 Z" |- A$ O8 h/ f1 o0 g
这种不是,这些都有对应的字符,xls里已经写了
# C; m' w; e: V; h, {6 _: V带点+横杠的e,i,u找不到,似乎可以用两个HTML实体拼

该用户从未签到

发表于 2015-11-7 12:26:18 | 显示全部楼层
本帖最后由 mitkyg 于 2015-11-7 12:35 编辑
2 n+ y" h9 B" H4 W
bt4baidu 发表于 2015-11-7 12:08
$ \0 p1 m/ l1 S5 D( B如果能找到所有插图就完美了
$ j/ W  K% ]8 r' b& M) X7 T; _1 z7 ^9 m6 }- y% B
只要按词头+.jpg/.png后缀命名,很容易合进去
1 `5 }9 t% h, D' Q0 F* h

3 R3 d1 O0 \+ g4 t. N
( S8 a8 C5 u0 ~7 e* hradical sign 书上是这样的," `' p  R5 M* f

. v/ H* d, P/ B. J3 f. S对比wbd的preview版; m( m  Q7 ~1 w2 Q9 W5 |7 W2 n
# W, V0 l( _2 q
* G% ^  h( n& \8 o. Y
把“根号16”也截出来替换下?后面也少了= the cube root of 27 = 3.
0 c& @) V7 i. s/ l7 ?: Y
: S3 z- k1 h' }, Y/ I再一个fraction) w2 @# X6 G7 q: P' l

8 [9 K  z; K5 h: s' h2 Q, P; O/ ~, x书上是这样的% Y& \4 {" \5 b0 y2 r( f: a
5 Q4 |" O- t1 {2 w5 B; U& r
都截出来替换下?# A  J% E% i+ \) `1 G- ^8 U* Q7 E

$ D/ n  f5 N& h( p7 F: z3 ^2 ?! ]7 `( Q
另,图片得一张张截取,2200多页,也不知道有多少张插图,尽快完工吧

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2015-11-7 12:35:24 | 显示全部楼层
贡献两个特殊字母:ǡ ȱ) j$ G4 H6 [- g. A
e的那个找没有。。。

该用户从未签到

 楼主| 发表于 2015-11-7 12:46:37 | 显示全部楼层
mitkyg 发表于 2015-11-7 12:26
1 c+ U+ ~' T( N/ kradical sign 书上是这样的,0 j* t" H) s: i' N' C' W6 }2 s

6 X: K4 G2 J' v& s* S. `/ {对比wbd的preview版

) o! ]7 ]" Z6 X7 Y& ^; A6 U2 ?, b书还是PDF?一页一页拍照?那工作量可不小: ?5 w) @2 _. e+ Y! T' h) a' F; J" P- t

) e3 R3 m" z6 I8 d& o6 r- t8 E# Z如果是PDF,ABBYY好像在OCR的时候可以自动抠出来的

该用户从未签到

发表于 2015-11-7 13:13:27 | 显示全部楼层
ė̄ ǡ u̇̄ ý̄ ẏ̄ b̆ ȱ b̄ ṇ
" j# X$ u5 h7 ?. C# g) u  a暂时先改了这几个。 希望能有用。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x
  • TA的每日心情
    无聊
    2019-11-17 14:10
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2015-11-7 13:25:21 | 显示全部楼层
    百度兄还有任务吗,我也想加入

    该用户从未签到

    发表于 2015-11-7 13:25:26 | 显示全部楼层
    bt4baidu 发表于 2015-11-7 12:46/ h* Z2 f* q: L/ M. h) x
    书还是PDF?一页一页拍照?那工作量可不小
    3 z( {& X7 i. R5 @+ C
    9 W6 i" ^8 V* T+ d& e如果是PDF,ABBYY好像在OCR的时候可以自动抠出来的
    - o" @% P( e1 I& @
    pdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定吧,试截几张,看看图片堪用不
    1 e% [, {7 {" s# L/ X, K8 U1 V8 v) T

    ) y: [+ f+ ]) s8 h" ?
    ) y  u3 Z4 i) j0 w& E7 [! K; t9 s3 ?1 S  \
    $ L6 Y! Y! i" J- x9 v3 g
      w0 }# X* R, p) {' i0 e* M  W- ?

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    点评

    图片截取后,我来做图片的优化和减小体积。还烦请私信  发表于 2015-11-9 22:30

    该用户从未签到

    发表于 2015-11-7 13:32:01 | 显示全部楼层
    我再领取“链接指向错误”所有2~125,这一项应该还没人领吧

    该用户从未签到

    发表于 2015-11-7 13:39:07 | 显示全部楼层
    qazqwe 发表于 2015-11-7 11:52
    - y* A" f$ _+ o: i原本的範例裡面是用ḗ 取代e DOT MACRON,
    $ {1 v! d: g* \, Z: R8 c! x有些是真的找不到, 像是LATIN SMALL LETTER y DOT MACRO ...
    ...ḗ 取代e DOT MACRONḗ 取代e DOT MACRON...
    : @- U$ l3 W: }) f6 b& h
    商榷: 如果实在没有可以办法, 宁可留存图片。& l/ j) `: e1 H0 G
    ...y DOT MACRON 還有類似 ȳ́         ȳ̀ 的寫法# c  J9 t5 U( Q8 H9 g, I, i/ i6 w9 G
    這要統一做法還是看每個認領的人主觀認定....
    / Q1 |! n" l+ i# F3 w
    商榷: 不存在主观认定的问题, 一切以原书/PDF内容的客观为准。. l# ?% a0 p3 j7 e" H3 {. ~. ^* b0 z
  • TA的每日心情
    无聊
    2019-11-17 14:10
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2015-11-7 13:39:07 | 显示全部楼层
    我也想领取“链接指向错误”任务或者“图片文本化”剩下的也可以,百度兄可以吗?

    该用户从未签到

     楼主| 发表于 2015-11-7 13:47:15 | 显示全部楼层
    mitkyg 发表于 2015-11-7 13:25
    . {4 k1 I1 P9 kpdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定 ...

    - Y4 G3 W1 Y/ i, e% ~质量不错啊,辛苦啦4 E$ e+ M; k/ T# C
    既然人工截取,保存的时候记得文件名存为"词头.png",不然就没法一一对应了+ U4 j5 H7 O0 }# S
    慢慢来,不着急
  • TA的每日心情
    奋斗
    2019-11-16 20:51
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2015-11-7 13:56:34 | 显示全部楼层
    ; f2 Q9 s1 A7 S6 G+ k1 A# c6 t
    我来做音标文字错乱61-120,请楼主批准!!!

    该用户从未签到

     楼主| 发表于 2015-11-7 14:11:40 | 显示全部楼层
    bsqby 发表于 2015-11-7 13:32
    7 \) ^' `" c! V' }. w9 T我再领取“链接指向错误”所有2~125,这一项应该还没人领吧

    & U( B+ H4 F. E4 G/ o- Y已分配,这个不太好改的

    该用户从未签到

     楼主| 发表于 2015-11-7 14:12:21 | 显示全部楼层
    fuxy526 发表于 2015-11-7 13:39  Z, G( q7 f6 A5 ~' s
    我也想领取“链接指向错误”任务或者“图片文本化”剩下的也可以,百度兄可以吗?
    # O! i& O! y' ]  @! m2 o$ \
    图片文本化剩下的都归你了,具体看XLS

    点评

    OK thx  发表于 2015-11-7 14:16

    该用户从未签到

     楼主| 发表于 2015-11-7 14:12:36 | 显示全部楼层
    shakahenryqht 发表于 2015-11-7 13:56
    4 l* x- x+ t: e4 m! D1 u9 V7 D我来做音标文字错乱61-120,请楼主批准!!!
    1 O. K  ]" w5 p2 J4 [: ?
    OK

    该用户从未签到

     楼主| 发表于 2015-11-7 14:31:28 | 显示全部楼层
    本帖最后由 bt4baidu 于 2015-11-7 14:33 编辑
    3 n8 t2 G* f2 L" \4 o( ?
    mitkyg 发表于 2015-11-7 13:252 N: R( i5 p) m2 E4 O/ T2 `' _9 _
    pdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定 ...
    6 s& S4 m3 ~* c! a4 {! i. u3 L
    7 X5 d# a! Q/ l" e) D, P5 b8 g6 ^
    , s/ H+ J$ i9 w) W  y
    ; s+ |( H% }$ ?* Y% N2 l3 F
    只要使用美图秀秀增强一下对比度,就可以把背景全部去掉

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2015-11-7 14:46:05 | 显示全部楼层
    本帖最后由 mitkyg 于 2015-11-7 14:53 编辑 & i4 x, A9 {5 _& x7 M* v
    bt4baidu 发表于 2015-11-7 14:31
    % }( Y8 h1 h1 o: P9 U只要使用美图秀秀增强一下对比度,就可以把背景全部去掉
    8 U' J+ R7 F6 ~$ m+ D5 D
    ! T# `4 `% M  d
    好,等图都截完了,我再用美图秀秀处理一下- ^7 I) y$ X- _+ q! G6 m2 @. F
      H+ z- J- O6 M% x1 R1 v
    同时我没有截“星号”,这样显得更美观些
  • TA的每日心情
    慵懒
    2023-2-4 11:26
  • 签到天数: 579 天

    [LV.9]以坛为家II

    发表于 2015-11-7 14:49:46 | 显示全部楼层
    想报名参加,不过以前没做过词典,不知道会不会给你们拖后腿啊??

    该用户从未签到

     楼主| 发表于 2015-11-7 14:58:01 | 显示全部楼层
    mitkyg 发表于 2015-11-7 14:46$ k! D0 ~$ i: K( @5 q
    好,等图都截完了,我再用美图秀秀处理一下

    : L; p) I8 n6 m7 z) k; `' @这个工作也可以用python做的,貌似增强对比度+图片去背景都可以用PIL图像处理自动完成- C1 R3 F5 k1 u1 F+ `2 i& A/ F* Z
    程序处理不了的再找你
    $ K2 Q2 @2 ~+ ?& I4 [
    6 d& }  ]9 g" S1 B3 i最关键的是文件名,这个不能和词头对应起来的话就只有手工了

    点评

    可以再尝试缩小图片体积,这个,到时候我来处理图片吧  发表于 2015-11-9 22:32

    该用户从未签到

    发表于 2015-11-7 15:13:24 | 显示全部楼层
    bt4baidu 发表于 2015-11-7 14:58- B- L( m) J2 u: L- }6 Y( Z3 I+ l
    这个工作也可以用python做的,貌似增强对比度+图片去背景都可以用PIL图像处理自动完成2 p: v% J6 I8 K3 |; O
    程序处理不了的再 ...

    ) G0 k7 v. j! b& }# c我刚截了24副图,对比一下,你用工具可以尝试下
    - r1 ?2 t1 |" o$ i) }2 D7 W! k4 h8 {9 X
    http://pan.baidu.com/s/1pJ5WYzp
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-14 14:41 , Processed in 0.022482 second(s), 17 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表