掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 2598|回复: 154

[词典校勘] ❤︎❤︎❤︎❤︎2/18/2021,英语常用词疑难用法手册2e校对

  [复制链接]
  • TA的每日心情
    开心
    2019-6-23 00:02
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    发表于 2020-10-23 22:14:54 | 显示全部楼层 |阅读模式
    本帖最后由 ogrishman 于 2021-2-18 22:48 编辑
    8 F* `- A1 S" M8 X0 l3 O* ^5 E1 j3 h2 k
    02/18/2021更新
    % E' Y/ V7 f) y0 c% t" `  L9 y
    / O: ?( D" X/ Q! s这是目前的校对结果和pdf文件以及扫描的图片文件:
    ' s4 N$ ]4 V# u* Z+ G4 `https://files.fm/u/x8gxnnpyc#/list/2 f7 N9 X5 j) }8 c1 H3 W4 n
    希望有能力的朋友帮忙制作成词库免费分享,提前谢过!  i+ x  J1 T/ b, P% d
    文件总共4.2G左右,分卷压缩每个50MB,解压密码是:% a' O, V9 E% H2 x! h. H4 z
    游客,如果您要查看本帖隐藏内容请回复
    ; r) `5 }& n& B/ }

    2 J3 @& y# [) N9 {( X3 V) K  T9 Q7 j3 F1 Q* s+ x+ X

    % U; E( L' ^; l0 c+ f7 x感谢大家的祝福和版主对我帖子的高亮!我受伤的情况远比我预估的要严重,经鉴定我是3级伤残,生活自理都存在重大问题,英语对于我的用处也已不大,我的实际情况也无法让我继续做那个词典了。抱歉了诸位,让你们失望了!不过我已经在联系版主,让他能自己或者找人接替我的工作,我会把所有大家校对的结果和PDF的扫描档发给版主,制作完成后免费分享给大家。如果有朋友愿意接手这个工作也可以和我联系,不过我希望你是有技术能力也有自己词典作品的朋友(喽啰骗资料的就别来了,你们等等,反正最后会免费分享给大家的,我需要的是真心帮忙的有技术能力的朋友)。
    . m7 q* |0 c8 f" L2 c6 j* `2 _; U祝大家身体健康、学习进步,英语早日达到母语人士水平!
    " C  S- M* H8 n+ R) p

    # \4 T9 ]; ?: ?; P" ?0 [/ H' b8 P  J& D6 L

    7 @& W, x3 x3 H& @7 i) ?& y2 n; Q12/25/2020更新
    ; b; g$ U9 t' Y" M; r# y
    . V5 o! L2 U) e! H( U3 @+ R( @4 s祝大家大家圣诞节快乐!前几天被暴打的非常严重,经过医院检查才知道,两个腿一个小腿骨折,另一个腿膝盖骨折,左臂被砍伤,后脑头皮被地面摩擦的头发掉光血肉模糊,而且已经检查有轻微脑震荡。还好右手能自由活动,这才能用手机和大家沟通,看看手机度日。现在自己看到自己的样子都感觉像看恐怖片一样!这俩天排队总算把手术也做了,现在每时每刻都痛不欲生啊。我的另一个同事一个胳膊被砍的只剩一点皮肉和身体连着,一个腿骨折,头上被砍了一斧头,也有脑震荡。悲夫!放两张图片证明我所言非虚,为了不影响大家心情我就不多放细节图片了。前两天我发了个帖子,狠多人都祝我早日康复,弟在此一并谢过诸位!在此祝诸位圣诞快乐,新年快乐,一切顺利!
    + \2 i8 U) T1 E3 z0 y' Q' v( y
    ( P0 R, \0 E. K5 c7 q* Z1 h( P/ i
    " `; c( J1 W  R' D6 y7 @% f
    , m& ?/ j. W- s5 w; d" N4 @  J
    * a2 r, S9 j  F' c- t5 \

    0 J& W4 Q0 E' x9 h; L8 ^% T2 r4 S# c6 W2 \9 t. ^! e' q; D) }
    3 y2 i" }" N1 P5 t0 A! J

    2 ^5 N# e! X* ?; `- t# L
    3 W7 @# p! J9 a" a12/21/2020更新! g' Q+ _3 r; M' a. C
    本来计划12月25日就可以出差回来继续做这个工作,结果人算不如天算啊。年底了,公司派出去要账。其中江西的某公司人员一言不合就动手,而且是一帮人。我与另一个同事被打的头破血流,腿也断了,全身是伤,在别人的帮助下我们才得以脱身。现在我在医院躺着更新这个帖子。医生讲我应该在过年前能出院,到时候回家我再继续这个OCR的工作。给大家说一下情况,抱歉了诸位,让你们久等了。$ O5 k; b: @! n5 O3 `
    / F( ~- v" |$ J1 j( `: v: U0 Y- Z1 p
    12/06/2020更新
    7 Z6 ]1 P- j" d# ^& V) L
    7 C# D# a  {* z" C0 M4 {+ H  F& O我这一阵子出差了,暂时停滞没法继续,12月25日我会继续开始这个项目工作。: v5 k2 y- U' x+ l+ d, n
    , {% \$ F1 Q' n* N$ j8 z% a
    所有人都已经完成自己的校对任务,我已经开始处理制作mdx。发现有三个人不看我的操作指导,不知道是怎么操作的,反正最后给我的HTML是从Word里导出的,导致这三个HTML的结构和其他人的HTML结构完全不一样,这样根本没法统一处理。现在已经联系这三个人,让他们发送当时校对的项目文件给我,我需要重新导出HTML。
    5 E% |3 F1 d& D3 K
    * N5 x* U( ]+ V' M  Y从这件小事能看出来不管你做什么事情,工作中还是生活中,首先要了解清楚最终的需求!需求不清楚,你无论付出了多大努力都是不可能达到目标的。另外万不可自作聪明,觉得自己懂,就压根不去了解需求,这更是错上加错。
    . J7 h7 Q% N8 m1 I. q3 }

    * u% [1 h! n  X. d" ?2 D0 M
    ' Q7 j# C9 U' [* U" y' d4 p8 I- E5 m( U8 C& V% v
    ( w5 f3 f# z5 m  {! ~) _9 `; n* i! I
    & H# z) T1 v! V0 \! Y7 G

    $ l3 c( \' M, }: n原帖内容( K% {( ]2 o, D4 k+ d* W0 n
    5 I8 N3 u- K/ O9 y- s8 g" q
    我想召集一些人共同校对OCR《英语常用词疑难用法手册第二版》的结果。具体细节如下:
    " a7 ?% D3 ^) b0 M9 ?9 q' Q
    9 S, R% [+ I2 h; F- s* 每人校对不超过60页; W1 Q6 W, c; X: U
    * 我提供软件(ABBYY FineReader)和校对方法,我会录制一个视频,大家必须按照视频里的操作来进行,保证每个人的操作都是一样的- z  C7 I5 @8 M$ f
    * 我提供给每个人需要校对的PDF文件4 i+ `8 n5 \, z% A2 y+ N
    * 参与校对的人最终可以获得我制作的mdx格式的词库
    - u) {' [& n% ^* {8 e* 参与者收到文件后一星期内必须完成任务(我测试了一下,ABBYY FineReader OCR的结果绝大多数都是正确的,校对一页大概需要10分钟左右吧)
    2 y1 s: F" e1 z( p' l
    7 l9 J3 w% H! q% B6 N5 b" d" H1 g; n/ y6 k$ D! a7 m" p% S
    没参与的人想要获得最终的mdx必须赞助,赞助的费用除掉我买书和找人扫描的成本外,剩余部分我会平均分给参与校对的朋友。
    3 ]6 }3 m$ i0 d# Q+ a; C$ [& d2 q! ]! r, c  _
    有意参加的人回帖表明或者给我发消息。
    ) W. |0 r7 a2 M/ P2 K  J+ M9 s: V, Q

    评分

    3

    查看全部评分

    本帖被以下淘专辑推荐:

  • TA的每日心情
    慵懒
    半小时前
  • 签到天数: 795 天

    [LV.10]以坛为家III

    发表于 2020-10-24 14:14:20 | 显示全部楼层
    不必等凑齐40人,每个人空余时间是不一样的。
      f' U/ ^" f$ _. s这两天刚好周末,现有的10多人可以开始先分配起来,校对出书的前四分之一。
  • TA的每日心情

    前天 09:27
  • 签到天数: 354 天

    [LV.8]以坛为家I

    发表于 2021-2-19 14:00:38 | 显示全部楼层
    谁能想到在一个以交流学习为目的的论坛还能看见这么一幕悲剧呢?虽然与您素昧平生,我很感激您组织起这么一次活动,从而让我学到一些诸如abbyy软件使用的知识和技巧。我觉得任何在没有现有数据可利用的情况下,以一己之力想要电子化书籍,特别是像词典百科全书或者冷门年代久远的书籍,都是功德无量的,愿上天保佑善良的您,也希望您有朝一日重拾英语。
  • TA的每日心情
    奋斗
    1 小时前
  • 签到天数: 155 天

    [LV.7]常住居民III

    发表于 2021-2-18 08:53:53 | 显示全部楼层
    兄弟,还想着春节回来能听到你的好消息!既然现在已经这样了,安心养伤,多养养能恢复的,以后你继续用英语的日子还多着呢,保持良好心态,把伤养好,大家在论坛等着你健康回归!!
  • TA的每日心情
    慵懒
    昨天 01:36
  • 签到天数: 186 天

    [LV.7]常住居民III

    发表于 2020-12-21 15:11:32 | 显示全部楼层
    啊这……有些地方的民风的确是一言难尽/ k; j  Y9 |+ m8 {! u
    距离精神脱贫还很遥远  @/ M  A7 m) X* N  N' ^& s
    祝愿楼主能尽早恢复健康良好状态
  • TA的每日心情
    慵懒
    半小时前
  • 签到天数: 795 天

    [LV.10]以坛为家III

    发表于 2020-11-2 17:36:36 | 显示全部楼层
    帮顶一下,希望更多朋友继续加入
  • TA的每日心情
    无聊
    2021-1-15 05:13
  • 签到天数: 271 天

    [LV.8]以坛为家I

    发表于 2020-10-24 20:21:34 | 显示全部楼层
    报名参加!
    / h" j0 O3 i) r( Z' T3 v# y. o  C- C1 B+ g
    另: 小小的建议: 每个人的硬件环境 (Mac 上的 ABBYY 软件版本落后太多) 和电脑软件操作知识以及对教学视频内容理解的不一致, 依然有可能导致每个人交出的结果不能完全一致, 所以建议楼主看能不能把 ABBYY FineReader OCR 这部分统一完成了, 然后分发需要校对的内容大家根据要求完成, 这样估计报名的人会多一些而且完成质量可能会更好一些. / [( m/ `, C( S) C# [. a
    当然这只是个建议, 楼主作为发起人请自行定夺...

    点评

    谢谢支持!关键这个软件本身在校对这个步骤上能起到很大作用,所以最好是大家自己OCR自己的部分。Mac上我会随后测试一下看看有没有大的不通。  发表于 2020-10-24 20:43
  • TA的每日心情

    2020-11-5 07:56
  • 签到天数: 15 天

    [LV.4]偶尔看看III

    发表于 2020-10-23 23:01:07 | 显示全部楼层
    这个陈用仪的第二版,和第一版 内容上真的有区别么?还是出版社把完全同样的内容又出了一遍?

    点评

    有删有加,而且改了一些错误。我随便抽查了十个词条没有一个和第一版完全一样的。  发表于 2020-10-23 23:11
  • TA的每日心情
    奋斗
    2021-2-4 23:25
  • 签到天数: 166 天

    [LV.7]常住居民III

    发表于 2020-10-24 00:13:59 | 显示全部楼层
    有兴趣参与,先报名一个~

    点评

    好的,谢谢,咱们继续等等看能凑集40人不。  发表于 2020-10-24 00:56
  • TA的每日心情
    开心
    2020-10-25 06:08
  • 签到天数: 127 天

    [LV.7]常住居民III

    发表于 2020-10-24 08:56:02 | 显示全部楼层
    《英语常用词疑难用法手册》出第二版了,好书。报名参加。

    点评

    好的,谢谢,咱们继续等等看能凑集40人不。  发表于 2020-10-24 09:45

    该用户从未签到

    发表于 2020-10-24 09:33:26 | 显示全部楼层
    把我拉进来……25页可以说是非常轻松咯

    点评

    好的,谢谢,咱们继续等等看能凑集40人不。  发表于 2020-10-24 09:44
  • TA的每日心情
    开心
    2020-10-9 08:46
  • 签到天数: 38 天

    [LV.5]常住居民I

    发表于 2020-10-24 09:40:53 | 显示全部楼层
    25页大概需要多少小时核对1 f$ d6 M* Z; r8 i+ @

    点评

    大概4五个小时,这是估算哦。  发表于 2020-10-24 09:44
  • TA的每日心情
    奋斗
    1 小时前
  • 签到天数: 155 天

    [LV.7]常住居民III

    发表于 2020-10-24 10:22:21 | 显示全部楼层
    从来没有干过这活,想参与一下,毕竟下了这么多好的资源,也该回馈一下,楼主,算我一个!一个小建议:人数不到40也可以开始,每个人多校对几页,能把好东西做出来最重要!

    点评

    好的,谢谢,咱们继续等等看能凑集40人不  发表于 2020-10-24 10:43
  • TA的每日心情
    慵懒
    半小时前
  • 签到天数: 795 天

    [LV.10]以坛为家III

    发表于 2020-10-24 13:47:31 | 显示全部楼层
    经典好书,报个名参加

    点评

    好的,谢谢,咱们继续等等看能凑集40人不  发表于 2020-10-24 13:53
  • TA的每日心情
    难过
    2021-1-29 20:50
  • 签到天数: 199 天

    [LV.7]常住居民III

    发表于 2020-10-24 16:38:11 | 显示全部楼层
    零基础小白,但也默默报个名。

    点评

    谢谢支持!  发表于 2020-10-24 17:24
  • TA的每日心情
    开心
    2 小时前
  • 签到天数: 1229 天

    [LV.10]以坛为家III

    发表于 2020-10-24 17:26:12 | 显示全部楼层
    没用过ABBYY FineReader,零基础学习学习,报名参加。

    点评

    谢谢支持!  发表于 2020-10-24 17:28
  • TA的每日心情

    前天 09:27
  • 签到天数: 354 天

    [LV.8]以坛为家I

    发表于 2020-10-24 18:51:45 | 显示全部楼层
    报名参加,为好资源的诞生出自己的一份力

    点评

    谢谢支持!  发表于 2020-10-24 18:53
    谢谢????  发表于 2020-10-24 18:52
  • TA的每日心情

    前天 21:46
  • 签到天数: 120 天

    [LV.7]常住居民III

    发表于 2020-10-24 21:09:49 | 显示全部楼层
    做图像切图版的如何呢?我愿意赞助
  • TA的每日心情

    前天 21:46
  • 签到天数: 120 天

    [LV.7]常住居民III

    发表于 2020-10-24 21:10:03 | 显示全部楼层
    做图像切图版的如何呢?我愿意赞助
  • TA的每日心情
    开心
    9 小时前
  • 签到天数: 193 天

    [LV.7]常住居民III

    发表于 2020-10-24 21:46:42 | 显示全部楼层

    ( Q$ C4 n8 T2 B7 v报名参加,为好资源的诞生出自己的一份力; 另外,我已经买了这本书,值得做!
    9 Q( {8 |1 n( y8 f" _+ r) P% V

    点评

    谢谢支持!  发表于 2020-10-24 22:29
  • TA的每日心情
    奋斗
    3 小时前
  • 签到天数: 347 天

    [LV.8]以坛为家I

    发表于 2020-10-25 15:12:26 | 显示全部楼层
    报名参加,几个小时还是能够挤出来的,希望早日成功。

    点评

    谢谢!  发表于 2020-10-25 16:09
  • TA的每日心情
    慵懒
    半小时前
  • 签到天数: 795 天

    [LV.10]以坛为家III

    发表于 2020-10-28 12:35:44 | 显示全部楼层
    如果对HTML代码、正则表达式很熟,可在OCR后导出html,然后直接用VSCode编辑html文件。) S3 W8 v' K5 O
    : b5 m/ @# o5 \5 {  u9 b9 _4 \
    很多OCR错误是相同的,可以批量代换。) L# v) c, K6 Y5 a( t
    : d- ]5 ]/ W9 R! L2 s( J- G# Q
    HTML标签正则替换后只需要很少几对就够用了,这样文件很小,校对时也比较清晰
    8 e3 e$ O0 h" i7 j; h<h3></h3>0 [/ I. [! a* v$ J) I6 S
    <sup></sup>7 a7 h; A( _! W# G& K- W! Y3 ~, i; D
    <p></p>& R# W( j$ h- `0 g5 x
    <b><i><u> </b></i></u>7 O2 s* w1 r) ~
    <i></i>
    5 e0 ]! c3 U  A) N3 G! z' C3 N2 ?  y
    % o/ D4 T, k& k6 }. a例句和解说OCR并不是分得很清,可在所有校对完成时,1 d- k9 s. m6 t4 F3 u
    自定义一个标签<exp></exp>去用正则判断+手工调整(用<span></span>也行)
    " T4 t$ _6 {$ N" g7 E$ ?. K
    " j% |8 o7 h- b# _
  • TA的每日心情
    开心
    2019-6-23 00:02
  • 签到天数: 18 天

    [LV.4]偶尔看看III

     楼主| 发表于 2020-10-28 13:14:08 | 显示全部楼层
    huala 发表于 2020-10-28 12:356 p  ?) D  l5 G
    如果对HTML代码、正则表达式很熟,可在OCR后导出html,然后直接用VSCode编辑html文件。
    ( ~* ^) ]1 P/ s+ h* ?5 v
    : T- }  p1 x! }* \$ W1 f# b  z很多OCR错误是相同 ...
    8 u/ f* f, i% \5 ]; j  b
    你是说直接修改导出的HTML来校对么?在这里面批量替换不是很可靠,比如原始pdf中的一个句号“。”被识别成了字母“o”,没有办法找出所有的这种情况来批量替换的。至于这个校对软件生成的HTML那我肯定是要重度修改的,它生成太复杂。
  • TA的每日心情
    慵懒
    半小时前
  • 签到天数: 795 天

    [LV.10]以坛为家III

    发表于 2020-10-28 17:32:12 | 显示全部楼层
    并不是说所有情况都直接批量代换; ~6 U7 x9 q' g; S
    类似句号“。”被识别成了字母“o”,替换时采用逐个检索的方法,符合即替换
  • TA的每日心情
    开心
    2019-6-23 00:02
  • 签到天数: 18 天

    [LV.4]偶尔看看III

     楼主| 发表于 2020-10-28 17:57:22 | 显示全部楼层
    huala 发表于 2020-10-28 17:32! K* N) \, F( x6 B- P
    并不是说所有情况都直接批量代换( d$ u! J, }; T$ R. C- F3 C) e
    类似句号“。”被识别成了字母“o”,替换时采用逐个检索的方法,符合即替 ...
    4 w5 Z& ]$ I/ \3 {
    那要把整个文件里的所有字母“o”都检查一边吗?这可能还不如用Abbyy帮助你把可能有问题的地方校对一下。我还只是举了一个例子,肯定还有其他情况,不可能手工把所有情况用肉眼观察“是否应该替换”的。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    顶部qrcode底部
    关注掌上百科官方微信公众号送积分
    关注掌上百科官方微信公众号
    关注微信公众号 pdawiki,获取邀请码,看文抢积分,抽奖得浮云! Follow our Wechat official account "pdawiki", get invitation codes, and play the lottery to earn points (积分)!

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2021-3-7 10:43 , Processed in 0.069820 second(s), 31 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2020, Tencent Cloud.

    快速回复 返回顶部 返回列表