掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

楼主: bt4baidu

[词典校勘] 【精校人员募集】World Book Dictionary, 2015 勘误专帖

[复制链接]

该用户从未签到

 楼主| 发表于 2015-11-7 11:57:19 | 显示全部楼层
empenguin20 发表于 2015-11-7 04:05
6 t$ D% l3 z1 v9 W* L鉴于楼上都不严格按照规定数额认领,我也来凑个热闹。认领图片文本化,65至125。! t' N5 C' f$ A0 F! E
我想问下楼主,音标为何 ...

% w4 P' o! i5 N$ ^所有修改都有记录,可以慢慢来确认,一次就100%正确不太可能: H6 r4 F" [9 u, p8 o
8 R' N2 |/ ~$ x! e( A3 c) C8 O
那个带上横杠的 ė还有i、u̇等,实在是找不到啊。。。
/ F+ _8 a3 i9 k7 D& g3 B
# o8 e4 F2 I- b+ W8 @; x用两个HTML实体字符似乎能勉强拼出来 ė̄=& #x0117;& #x0304;

该用户从未签到

 楼主| 发表于 2015-11-7 12:00:04 | 显示全部楼层
qazqwe 发表于 2015-11-7 11:52
! P$ o9 d7 f! ]" c- r原本的範例裡面是用ḗ 取代e DOT MACRON, 2 }0 Q# ?' a4 {  y" s! X5 {  g
有些是真的找不到, 像是LATIN SMALL LETTER y DOT MACRO ...

; g& {: z/ u) S" b' x1 I完工以后可以用HTML实体字符拼$ X/ ]: ]% J2 Q+ }# ^9 ^9 X
比如ė̄ = & #x0117;& #x0304;
- H+ S6 q- e. X2 V4 j6 r1 }2 N8 ~# H5 P) i* c" y8 y
参考别人的写法,保持一致就行,后面可以全文替换

该用户从未签到

 楼主| 发表于 2015-11-7 12:04:21 | 显示全部楼层
dhs1001 发表于 2015-11-7 10:43
1 t, r2 q, o) u: |  e. M: `把9楼empenguin20兄的下载回来看了一下,发现对于ryuya兄所提示需要对照文件名存有一些疑问。; j1 Z% z0 d( m0 r* g
从empen ...
# u: h7 v' |! v9 E5 u
能找到对应字符的尽量用对应的字符,实在找不到的,可以先用类似字符代替,后面再想办法
  h# S7 O) f& z

该用户从未签到

 楼主| 发表于 2015-11-7 12:08:08 | 显示全部楼层
mitkyg 发表于 2015-11-7 06:51
8 w1 N/ e9 v. j6 v) O我又来了
. M; s, K8 _, h+ x7 e7 A* V/ u. c6 Y5 `, c9 s' N& X/ r
认领 1、符号or插图: 11条,募集1人
! c5 A2 |/ b$ Q. J4 x
如果能找到所有插图就完美了
! S* ]* `1 I* k6 ~+ M8 y
* `' \7 _0 `9 x, X只要按词头+.jpg/.png后缀命名,很容易合进去% e: c  q& @% D  S5 K
如果足够清晰,背景为单纯白色,还可以写程序把背景透明化

该用户从未签到

发表于 2015-11-7 12:12:31 | 显示全部楼层
bt4baidu 发表于 2015-11-7 11:57
/ I3 y. s  N+ M所有修改都有记录,可以慢慢来确认,一次就100%正确不太可能+ Y1 q( A/ }: J/ {) `# s; r+ M
1 Y! J: i+ \3 M5 `0 x! F) O# B7 v
那个带上横杠的 ė还有i、u̇等 ...

+ p# K9 B3 f; M! I0 ~带橫杠的ē,ī  , ū都是由两个字符(字母本身和UNICODE编码是\u0304这个字符)来表示的

该用户从未签到

 楼主| 发表于 2015-11-7 12:23:38 | 显示全部楼层
tsiank 发表于 2015-11-7 12:12
5 i0 G; W4 `  l$ r, r带橫杠的ē,ī  , ū都是由两个字符(字母本身和UNICODE编码是\u0304这个字符)来表示的
) J! `8 ~9 A% d; P* v
这种不是,这些都有对应的字符,xls里已经写了% |2 C) |; O  v; O7 Y
带点+横杠的e,i,u找不到,似乎可以用两个HTML实体拼

该用户从未签到

发表于 2015-11-7 12:26:18 | 显示全部楼层
本帖最后由 mitkyg 于 2015-11-7 12:35 编辑
' A8 P( F* I3 r  Y! @! V
bt4baidu 发表于 2015-11-7 12:084 Z& W/ u2 t4 B
如果能找到所有插图就完美了8 D6 C3 L, }& _" L; F
2 i+ @3 Y3 h+ p/ Z
只要按词头+.jpg/.png后缀命名,很容易合进去

, g9 H! B  S7 q$ l: r& V2 E  W5 e' B) F& |( ~; ^
/ n5 S" I0 ]3 I8 I+ Q
radical sign 书上是这样的,. Z0 S$ [& v; |. }/ p. f

% J( w, ^7 q; \, a: q对比wbd的preview版4 @7 v3 d# u2 J0 C2 P# D1 U

) {2 w' C5 l! d" B' ]  ?- u  ~
0 D) H8 z$ S( A$ G" h  `把“根号16”也截出来替换下?后面也少了= the cube root of 27 = 3., _; }. d* h/ }: ~9 A4 Z' e
. ^6 j  a" f1 d5 w8 i9 j
再一个fraction
4 w0 A$ p2 b6 x: {0 r% _, n9 R$ p) u) ]- }, _8 C! D  i
书上是这样的
1 [- W, u: Y+ j% K6 G( H: N7 L 9 n6 g2 Y$ ^/ [% H2 S4 K" O) t( r
都截出来替换下?
8 V* E* Z7 B7 O3 G
5 W# W2 k1 s* c6 f* G7 u5 @
' a; \' u. P- k( V另,图片得一张张截取,2200多页,也不知道有多少张插图,尽快完工吧

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2015-11-7 12:35:24 | 显示全部楼层
贡献两个特殊字母:ǡ ȱ) k3 l+ W  C& S5 f: v
e的那个找没有。。。

该用户从未签到

 楼主| 发表于 2015-11-7 12:46:37 | 显示全部楼层
mitkyg 发表于 2015-11-7 12:26: J0 e5 ?8 |/ v9 q: `( z
radical sign 书上是这样的,
0 ~+ g6 t! e" I1 D
1 U  `3 Z, o9 O  ], P) M3 @对比wbd的preview版

6 ^* i: `: b0 @4 C" @0 D$ t书还是PDF?一页一页拍照?那工作量可不小
1 }8 `6 C# ^  S( H7 b. T$ ^- ?, Z' }. z0 t2 M( p
如果是PDF,ABBYY好像在OCR的时候可以自动抠出来的

该用户从未签到

发表于 2015-11-7 13:13:27 | 显示全部楼层
ė̄ ǡ u̇̄ ý̄ ẏ̄ b̆ ȱ b̄ ṇ
5 y+ i, q* ?9 v. c7 X5 D暂时先改了这几个。 希望能有用。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x
  • TA的每日心情
    无聊
    2019-11-17 14:10
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2015-11-7 13:25:21 | 显示全部楼层
    百度兄还有任务吗,我也想加入

    该用户从未签到

    发表于 2015-11-7 13:25:26 | 显示全部楼层
    bt4baidu 发表于 2015-11-7 12:46
    + Q* ?6 o8 X* n5 g/ `  u2 w2 H; c& C书还是PDF?一页一页拍照?那工作量可不小% u( b2 i" s1 i- ~
    ( n' ], ?9 t' N* R
    如果是PDF,ABBYY好像在OCR的时候可以自动抠出来的

    0 H5 A, Y5 i+ x! v1 bpdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定吧,试截几张,看看图片堪用不2 M, l% g8 l4 M* y8 z- z: S

    + h  G! \; z* U4 r6 t- x
    " w$ _  k- @, q* Y
      A. s4 k0 r1 n6 Z, y  q
    2 G/ B0 o* n- _' ~+ i. [+ H/ d/ j6 ~; ~* `  d
    4 d" ]' M7 k) _9 Z

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    点评

    图片截取后,我来做图片的优化和减小体积。还烦请私信  发表于 2015-11-9 22:30

    该用户从未签到

    发表于 2015-11-7 13:32:01 | 显示全部楼层
    我再领取“链接指向错误”所有2~125,这一项应该还没人领吧

    该用户从未签到

    发表于 2015-11-7 13:39:07 | 显示全部楼层
    qazqwe 发表于 2015-11-7 11:52: Z: q/ K7 v$ Z2 Y7 ]+ L
    原本的範例裡面是用ḗ 取代e DOT MACRON,
    - U% N# i6 g( N! x有些是真的找不到, 像是LATIN SMALL LETTER y DOT MACRO ...
    ...ḗ 取代e DOT MACRONḗ 取代e DOT MACRON...

    3 ^% A' A( }6 L" W% e商榷: 如果实在没有可以办法, 宁可留存图片。
    $ ~& K; @5 y/ U" _
    ...y DOT MACRON 還有類似 ȳ́         ȳ̀ 的寫法# c  J9 t5 U( Q8 H9 g
    ! L  f: H7 z4 r" W+ w這要統一做法還是看每個認領的人主觀認定....
    * I# n5 z( O' p: @# |' @
    商榷: 不存在主观认定的问题, 一切以原书/PDF内容的客观为准。
    ( K& U) C5 P* O
  • TA的每日心情
    无聊
    2019-11-17 14:10
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2015-11-7 13:39:07 | 显示全部楼层
    我也想领取“链接指向错误”任务或者“图片文本化”剩下的也可以,百度兄可以吗?

    该用户从未签到

     楼主| 发表于 2015-11-7 13:47:15 | 显示全部楼层
    mitkyg 发表于 2015-11-7 13:25
    3 H# G7 L" Y7 z, Lpdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定 ...
    , C/ N6 u, E& p2 u& O3 u7 i
    质量不错啊,辛苦啦( @. F0 p( p# U) A2 f0 E
    既然人工截取,保存的时候记得文件名存为"词头.png",不然就没法一一对应了
    " a  `6 [+ \2 K" j. M慢慢来,不着急
  • TA的每日心情
    奋斗
    2019-11-16 20:51
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2015-11-7 13:56:34 | 显示全部楼层
      p1 m  G% v4 S
    我来做音标文字错乱61-120,请楼主批准!!!

    该用户从未签到

     楼主| 发表于 2015-11-7 14:11:40 | 显示全部楼层
    bsqby 发表于 2015-11-7 13:32
    ! V( B& g# ~/ ]! Y我再领取“链接指向错误”所有2~125,这一项应该还没人领吧

    8 e2 w9 p5 o6 `# B; ]" m已分配,这个不太好改的

    该用户从未签到

     楼主| 发表于 2015-11-7 14:12:21 | 显示全部楼层
    fuxy526 发表于 2015-11-7 13:39' y1 o* S0 B% I# U3 ]
    我也想领取“链接指向错误”任务或者“图片文本化”剩下的也可以,百度兄可以吗?

    * I) s) q* e  v; m' n图片文本化剩下的都归你了,具体看XLS

    点评

    OK thx  发表于 2015-11-7 14:16

    该用户从未签到

     楼主| 发表于 2015-11-7 14:12:36 | 显示全部楼层
    shakahenryqht 发表于 2015-11-7 13:561 J- v; I" x4 x4 b3 b/ x
    我来做音标文字错乱61-120,请楼主批准!!!

    : u0 K$ N, C& T- l: QOK

    该用户从未签到

     楼主| 发表于 2015-11-7 14:31:28 | 显示全部楼层
    本帖最后由 bt4baidu 于 2015-11-7 14:33 编辑
    - D- X  s0 H4 H: H: w! U
    mitkyg 发表于 2015-11-7 13:25
    3 i* I9 K- l. r& Q" P6 Ypdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定 ...
    ; l  e( e8 S& m- Q

    " n' E5 c( F: P4 y" y& d( U' a$ G; \7 U' l+ P, J' v. P3 ^: B9 h9 l* L

    $ `" s& p0 j" c4 k- o只要使用美图秀秀增强一下对比度,就可以把背景全部去掉

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2015-11-7 14:46:05 | 显示全部楼层
    本帖最后由 mitkyg 于 2015-11-7 14:53 编辑 1 r- J. W! _( Z
    bt4baidu 发表于 2015-11-7 14:31
    2 G3 D: c0 j  Q5 ?9 p. k只要使用美图秀秀增强一下对比度,就可以把背景全部去掉

    ) ?. N; w! T/ p0 e& N1 Q
    0 Y6 ^" ]3 [4 n6 D; @* t1 i  M好,等图都截完了,我再用美图秀秀处理一下5 v3 _# {2 X. u9 E

    ) v/ ?; o+ N$ N: u) L, R6 _5 v同时我没有截“星号”,这样显得更美观些
  • TA的每日心情
    慵懒
    2023-2-4 11:26
  • 签到天数: 579 天

    [LV.9]以坛为家II

    发表于 2015-11-7 14:49:46 | 显示全部楼层
    想报名参加,不过以前没做过词典,不知道会不会给你们拖后腿啊??

    该用户从未签到

     楼主| 发表于 2015-11-7 14:58:01 | 显示全部楼层
    mitkyg 发表于 2015-11-7 14:46# y" Q# W' T+ l9 n. }
    好,等图都截完了,我再用美图秀秀处理一下
    9 h/ X; {4 n9 _
    这个工作也可以用python做的,貌似增强对比度+图片去背景都可以用PIL图像处理自动完成6 w, C" I/ `4 |% e/ V
    程序处理不了的再找你
    + ]+ s( H. o) g" T4 ~  g+ {+ n! u4 ~# X+ J5 q( R
    最关键的是文件名,这个不能和词头对应起来的话就只有手工了

    点评

    可以再尝试缩小图片体积,这个,到时候我来处理图片吧  发表于 2015-11-9 22:32

    该用户从未签到

    发表于 2015-11-7 15:13:24 | 显示全部楼层
    bt4baidu 发表于 2015-11-7 14:58# [% N, C5 a  V: ^9 N
    这个工作也可以用python做的,貌似增强对比度+图片去背景都可以用PIL图像处理自动完成
    7 Z/ L- d* B0 x7 U5 F. }1 c0 B' u程序处理不了的再 ...
    $ O0 S1 b( _0 F3 Y$ L
    我刚截了24副图,对比一下,你用工具可以尝试下 ! o3 ^! E. h  Q; j

    4 c- w! t) c! i# o1 c( X% ?http://pan.baidu.com/s/1pJ5WYzp
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-7-3 16:54 , Processed in 0.026386 second(s), 22 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表