掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

楼主: bt4baidu

[词典校勘] 【精校人员募集】World Book Dictionary, 2015 勘误专帖

[复制链接]

该用户从未签到

 楼主| 发表于 2015-11-7 11:57:19 | 显示全部楼层
empenguin20 发表于 2015-11-7 04:05
( t3 J+ E9 f! F+ ?' B鉴于楼上都不严格按照规定数额认领,我也来凑个热闹。认领图片文本化,65至125。
7 K* q. d1 Q4 `0 g0 c, ?我想问下楼主,音标为何 ...

6 k+ G3 [: u  b1 ~( f所有修改都有记录,可以慢慢来确认,一次就100%正确不太可能
. j7 R5 Q, U7 Z5 i: k4 t! m% f0 _" s9 S0 r+ Q
那个带上横杠的 ė还有i、u̇等,实在是找不到啊。。。
  _6 t5 O7 K! f0 Y1 Y* s1 P% w! F5 A8 }# C
用两个HTML实体字符似乎能勉强拼出来 ė̄=& #x0117;& #x0304;

该用户从未签到

 楼主| 发表于 2015-11-7 12:00:04 | 显示全部楼层
qazqwe 发表于 2015-11-7 11:52
9 k% K, y2 f( A* A. U* `6 v, E原本的範例裡面是用ḗ 取代e DOT MACRON,
/ D9 v# Z+ f8 C8 r- c3 s# l有些是真的找不到, 像是LATIN SMALL LETTER y DOT MACRO ...
$ v! B5 Y" G. l% y
完工以后可以用HTML实体字符拼
6 q  }. \% o% Q, f比如ė̄ = & #x0117;& #x0304;& B* l" p8 R# I
' T; Y9 w2 F* m& k5 v' U
参考别人的写法,保持一致就行,后面可以全文替换

该用户从未签到

 楼主| 发表于 2015-11-7 12:04:21 | 显示全部楼层
dhs1001 发表于 2015-11-7 10:43
0 y7 D+ C4 C3 o8 y5 e把9楼empenguin20兄的下载回来看了一下,发现对于ryuya兄所提示需要对照文件名存有一些疑问。, {' d5 I* S# }* u4 k( p6 R! g* u6 ]
从empen ...

5 B" p# N) Y. c. P! ?* D( n( R能找到对应字符的尽量用对应的字符,实在找不到的,可以先用类似字符代替,后面再想办法
, a4 [, x) O  H0 z( _0 K& y. q

该用户从未签到

 楼主| 发表于 2015-11-7 12:08:08 | 显示全部楼层
mitkyg 发表于 2015-11-7 06:51
9 Q+ y. T6 p+ v, p1 D6 g我又来了; X# o3 y. N% ]: i9 Q5 z% G
, n% X7 @3 U! o& h! n' h7 U( h
认领 1、符号or插图: 11条,募集1人
" Y! T- X8 Z" N( c* J" ^  M& t, N
如果能找到所有插图就完美了! l1 [( c. A# P4 i$ O2 k1 p# J

9 d  h+ E% w8 X- h, t* ], T8 @只要按词头+.jpg/.png后缀命名,很容易合进去/ U& G% w% S6 @9 V& ]4 D% r9 U
如果足够清晰,背景为单纯白色,还可以写程序把背景透明化

该用户从未签到

发表于 2015-11-7 12:12:31 | 显示全部楼层
bt4baidu 发表于 2015-11-7 11:57% _3 T8 N2 ]5 s3 C) T3 E0 Q
所有修改都有记录,可以慢慢来确认,一次就100%正确不太可能9 a0 l  {+ b+ X8 }

6 b* F7 W1 k2 W0 h# B' A那个带上横杠的 ė还有i、u̇等 ...

/ f  Q8 n$ j) e1 p带橫杠的ē,ī  , ū都是由两个字符(字母本身和UNICODE编码是\u0304这个字符)来表示的

该用户从未签到

 楼主| 发表于 2015-11-7 12:23:38 | 显示全部楼层
tsiank 发表于 2015-11-7 12:128 \( u# i  Y9 D4 N% ^
带橫杠的ē,ī  , ū都是由两个字符(字母本身和UNICODE编码是\u0304这个字符)来表示的

! r! Z' o0 x. |$ G* ~$ O这种不是,这些都有对应的字符,xls里已经写了, v# q- Y) r1 m$ b  S! |9 P
带点+横杠的e,i,u找不到,似乎可以用两个HTML实体拼

该用户从未签到

发表于 2015-11-7 12:26:18 | 显示全部楼层
本帖最后由 mitkyg 于 2015-11-7 12:35 编辑
  M" a3 C! @' @# \3 L( f. K) b" m
bt4baidu 发表于 2015-11-7 12:08
7 P: U0 h! E) A: o, X如果能找到所有插图就完美了
0 V* r& e, }/ a6 Q3 C8 r2 Y1 i; r4 j) h; g2 ?' ?
只要按词头+.jpg/.png后缀命名,很容易合进去

1 U8 J7 Y, P* _. R
+ r) A$ U, U3 O. X) s0 I- P  \0 f3 V/ m' L2 C& ~
radical sign 书上是这样的,
$ S& H4 v% M9 }! E  J. b# `- r+ X$ n; s! m) T
对比wbd的preview版& Q  u( C9 H% I) E% s3 Q9 b
* Y4 s1 q) Q  a6 L

, N6 D% ?- x; C" E( ?  _把“根号16”也截出来替换下?后面也少了= the cube root of 27 = 3.' ^7 l2 D  f* _5 l  U2 d

8 e6 c0 t9 p; M4 e$ z5 u再一个fraction9 Z5 p% o1 S$ _9 ^  G7 d

: M( ~+ F, G4 e1 |9 U& R5 J书上是这样的9 z3 h3 H+ t" d: t

! b* c$ D1 D; v/ _ 都截出来替换下?! @! W1 A0 I' ]% V  Y
9 q& f5 K, C5 A

# w4 M5 e/ Z( S: ^/ Q" z' p2 `另,图片得一张张截取,2200多页,也不知道有多少张插图,尽快完工吧

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2015-11-7 12:35:24 | 显示全部楼层
贡献两个特殊字母:ǡ ȱ
8 N) J+ \: H, X6 o( t$ k, Ce的那个找没有。。。

该用户从未签到

 楼主| 发表于 2015-11-7 12:46:37 | 显示全部楼层
mitkyg 发表于 2015-11-7 12:26  [6 W( S4 E+ A
radical sign 书上是这样的,: _& c: Z. O7 h( o

. M; U+ w) T2 U6 E对比wbd的preview版
5 k: _! k) a8 s: C3 P
书还是PDF?一页一页拍照?那工作量可不小
8 [  a) L' J+ [$ L' N
. Z6 J  m7 N% _0 L  R# h9 i如果是PDF,ABBYY好像在OCR的时候可以自动抠出来的

该用户从未签到

发表于 2015-11-7 13:13:27 | 显示全部楼层
ė̄ ǡ u̇̄ ý̄ ẏ̄ b̆ ȱ b̄ ṇ1 r6 ?) R% z5 @8 G7 H
暂时先改了这几个。 希望能有用。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x
  • TA的每日心情
    无聊
    2019-11-17 14:10
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2015-11-7 13:25:21 | 显示全部楼层
    百度兄还有任务吗,我也想加入

    该用户从未签到

    发表于 2015-11-7 13:25:26 | 显示全部楼层
    bt4baidu 发表于 2015-11-7 12:46' M  A( S& }  v6 K) ~
    书还是PDF?一页一页拍照?那工作量可不小, I' c0 K, D2 m7 Y* d

    5 L/ D4 e7 y8 x1 o3 \! N如果是PDF,ABBYY好像在OCR的时候可以自动抠出来的

    - ]5 N: j' a, J" dpdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定吧,试截几张,看看图片堪用不
    5 f; @# N. W6 M7 Z$ [" E; j. U# l3 Z$ S* W

    9 R  w' k9 Y9 r2 i" D
      e6 W8 N3 v8 {4 o% s9 u% C0 T
    5 u6 R$ u5 ^% a
    + s- ~  z- M2 u9 Y. E6 z; [6 S) e" ]: C) D) ?' E' W! c

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    点评

    图片截取后,我来做图片的优化和减小体积。还烦请私信  发表于 2015-11-9 22:30

    该用户从未签到

    发表于 2015-11-7 13:32:01 | 显示全部楼层
    我再领取“链接指向错误”所有2~125,这一项应该还没人领吧

    该用户从未签到

    发表于 2015-11-7 13:39:07 | 显示全部楼层
    qazqwe 发表于 2015-11-7 11:52
    + [' C2 q; }* v( z6 _4 q9 |原本的範例裡面是用ḗ 取代e DOT MACRON,
    ; R# t4 m7 H8 h  I有些是真的找不到, 像是LATIN SMALL LETTER y DOT MACRO ...
    ...ḗ 取代e DOT MACRONḗ 取代e DOT MACRON...

    " d3 ]0 w' s" {+ |5 g: T; ]商榷: 如果实在没有可以办法, 宁可留存图片。
    1 }$ x% a; z" b$ j3 i
    ...y DOT MACRON 還有類似 ȳ́         ȳ̀ 的寫法# c  J9 t5 U( Q8 H9 g& A. y. X% J( [
    這要統一做法還是看每個認領的人主觀認定....
    1 l- t0 K1 R# ~6 E0 I5 J1 I' |* [/ P$ k
    商榷: 不存在主观认定的问题, 一切以原书/PDF内容的客观为准。, l% ^& q8 M+ I/ ~/ ^- o* `* I9 r
  • TA的每日心情
    无聊
    2019-11-17 14:10
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2015-11-7 13:39:07 | 显示全部楼层
    我也想领取“链接指向错误”任务或者“图片文本化”剩下的也可以,百度兄可以吗?

    该用户从未签到

     楼主| 发表于 2015-11-7 13:47:15 | 显示全部楼层
    mitkyg 发表于 2015-11-7 13:25
    ' b: h# M+ e6 ]7 mpdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定 ...
    # J) J3 G# s$ d1 J  r8 k7 H, |
    质量不错啊,辛苦啦! @& h% r4 ?% p. @+ q+ n
    既然人工截取,保存的时候记得文件名存为"词头.png",不然就没法一一对应了7 B5 f! K# [' s1 c( y
    慢慢来,不着急
  • TA的每日心情
    奋斗
    2019-11-16 20:51
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2015-11-7 13:56:34 | 显示全部楼层
    / G( O4 \. p1 Q( W
    我来做音标文字错乱61-120,请楼主批准!!!

    该用户从未签到

     楼主| 发表于 2015-11-7 14:11:40 | 显示全部楼层
    bsqby 发表于 2015-11-7 13:32% C0 \7 T$ Z, m& J% s/ S
    我再领取“链接指向错误”所有2~125,这一项应该还没人领吧

    + V5 Z; ?5 B! H' m( v已分配,这个不太好改的

    该用户从未签到

     楼主| 发表于 2015-11-7 14:12:21 | 显示全部楼层
    fuxy526 发表于 2015-11-7 13:39
    8 Z  a  s& R# d+ D' v我也想领取“链接指向错误”任务或者“图片文本化”剩下的也可以,百度兄可以吗?

    2 I: ~& F. b$ I( n: l6 p图片文本化剩下的都归你了,具体看XLS

    点评

    OK thx  发表于 2015-11-7 14:16

    该用户从未签到

     楼主| 发表于 2015-11-7 14:12:36 | 显示全部楼层
    shakahenryqht 发表于 2015-11-7 13:56
    & |! H, n  {' w* J3 d* Z- M我来做音标文字错乱61-120,请楼主批准!!!
    / W7 N. X; _  {! A
    OK

    该用户从未签到

     楼主| 发表于 2015-11-7 14:31:28 | 显示全部楼层
    本帖最后由 bt4baidu 于 2015-11-7 14:33 编辑 6 [1 J9 }( B" I8 U
    mitkyg 发表于 2015-11-7 13:25; F+ a! }* }0 J1 l
    pdf的,试了下,还是人工截取吧 图片清晰,不出错,符号or插图弄完了,词典插图争取三天内搞定 ...
    7 ~" K+ Q2 s, }' p1 f& T/ M8 w, k
    & N! C- j" R$ c1 ?2 N) Z8 S

    2 _8 W( }. ~# r2 B
    / a$ J3 G, _+ L9 |只要使用美图秀秀增强一下对比度,就可以把背景全部去掉

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2015-11-7 14:46:05 | 显示全部楼层
    本帖最后由 mitkyg 于 2015-11-7 14:53 编辑 " ]/ p+ G9 \$ P) k
    bt4baidu 发表于 2015-11-7 14:31
    $ n' Z* u9 _/ X) K  g3 x只要使用美图秀秀增强一下对比度,就可以把背景全部去掉

    : x% r' j  t# S7 l# J9 Z* q# S6 M/ ?! h* Z1 I
    好,等图都截完了,我再用美图秀秀处理一下
    9 x9 t% E# e2 t) I! f) w$ O; \$ |& h" b  A0 J* s5 Y$ F8 [  O* q
    同时我没有截“星号”,这样显得更美观些
  • TA的每日心情
    慵懒
    2023-2-4 11:26
  • 签到天数: 579 天

    [LV.9]以坛为家II

    发表于 2015-11-7 14:49:46 | 显示全部楼层
    想报名参加,不过以前没做过词典,不知道会不会给你们拖后腿啊??

    该用户从未签到

     楼主| 发表于 2015-11-7 14:58:01 | 显示全部楼层
    mitkyg 发表于 2015-11-7 14:46% S$ E6 Y8 N# g& Y( h
    好,等图都截完了,我再用美图秀秀处理一下
    / ~$ J, A1 H: c! a' b
    这个工作也可以用python做的,貌似增强对比度+图片去背景都可以用PIL图像处理自动完成
    - C5 a; u5 T; b6 }程序处理不了的再找你
    / C9 c- Y8 A# Y( g( @( J$ h( S1 R. I% u$ o9 P7 K8 R
    最关键的是文件名,这个不能和词头对应起来的话就只有手工了

    点评

    可以再尝试缩小图片体积,这个,到时候我来处理图片吧  发表于 2015-11-9 22:32

    该用户从未签到

    发表于 2015-11-7 15:13:24 | 显示全部楼层
    bt4baidu 发表于 2015-11-7 14:58
      H, N/ I; S: ~# V, Y; |这个工作也可以用python做的,貌似增强对比度+图片去背景都可以用PIL图像处理自动完成
    ) c) B$ ]! y; I4 z! w6 X/ ~" p' A程序处理不了的再 ...
    ) O" B3 P, @& U4 I2 Y
    我刚截了24副图,对比一下,你用工具可以尝试下 4 T  t6 v$ g7 B/ r- a' j
    ! H8 q& S- H. V9 L7 {4 w
    http://pan.baidu.com/s/1pJ5WYzp
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2026-6-5 18:07 , Processed in 0.022714 second(s), 17 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表