掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 7159|回复: 227

[词典校勘] ❤︎❤︎❤︎❤︎2/18/2021,英语常用词疑难用法手册2e校对

  [复制链接]
  • TA的每日心情
    开心
    2019-6-23 00:02
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    发表于 2020-10-23 22:14:54 | 显示全部楼层 |阅读模式
    本帖最后由 ogrishman 于 2021-2-18 22:48 编辑
    0 U  m: E) e% R- V* O8 F+ t/ w9 d5 V, x3 }5 f
    02/18/2021更新; \$ |( j5 Z; m* {

      X" r; G4 z/ w/ U. T$ G5 Z- j这是目前的校对结果和pdf文件以及扫描的图片文件:
    " g+ v; J' J2 n" c+ h( Chttps://files.fm/u/x8gxnnpyc#/list/
    7 k( t. E; S2 J' O" N希望有能力的朋友帮忙制作成词库免费分享,提前谢过!. F, O- u- W. q
    文件总共4.2G左右,分卷压缩每个50MB,解压密码是:
    $ y/ K& E: Y2 F( h
    游客,如果您要查看本帖隐藏内容请回复

    ! G! k1 [7 C9 @# l  _! ]7 @5 ]4 N& L( d  k. v# _/ \3 {# C4 t7 W
    ! y& ~( R" r2 ^1 k* y& Z

    % X( o9 @8 u+ j4 f7 F感谢大家的祝福和版主对我帖子的高亮!我受伤的情况远比我预估的要严重,经鉴定我是3级伤残,生活自理都存在重大问题,英语对于我的用处也已不大,我的实际情况也无法让我继续做那个词典了。抱歉了诸位,让你们失望了!不过我已经在联系版主,让他能自己或者找人接替我的工作,我会把所有大家校对的结果和PDF的扫描档发给版主,制作完成后免费分享给大家。如果有朋友愿意接手这个工作也可以和我联系,不过我希望你是有技术能力也有自己词典作品的朋友(喽啰骗资料的就别来了,你们等等,反正最后会免费分享给大家的,我需要的是真心帮忙的有技术能力的朋友)。
    5 p  ?6 Y/ \7 {" _- x# H) T祝大家身体健康、学习进步,英语早日达到母语人士水平!8 b5 k! _. g* ~: x* H* h
    7 t2 E9 X: g. I- H1 \
    5 o+ B6 `. E5 b8 b# T8 Q" h& }6 n- O

    . k/ c! ~& H( P4 J7 K; M  R+ a12/25/2020更新1 b! |' P' i) {) j
    ; U) C% v: i5 X; w" Z- a  n
    祝大家大家圣诞节快乐!前几天被暴打的非常严重,经过医院检查才知道,两个腿一个小腿骨折,另一个腿膝盖骨折,左臂被砍伤,后脑头皮被地面摩擦的头发掉光血肉模糊,而且已经检查有轻微脑震荡。还好右手能自由活动,这才能用手机和大家沟通,看看手机度日。现在自己看到自己的样子都感觉像看恐怖片一样!这俩天排队总算把手术也做了,现在每时每刻都痛不欲生啊。我的另一个同事一个胳膊被砍的只剩一点皮肉和身体连着,一个腿骨折,头上被砍了一斧头,也有脑震荡。悲夫!放两张图片证明我所言非虚,为了不影响大家心情我就不多放细节图片了。前两天我发了个帖子,狠多人都祝我早日康复,弟在此一并谢过诸位!在此祝诸位圣诞快乐,新年快乐,一切顺利!
    " H" G: Z; c* Y

    ; N: [+ P) O" g) ]+ s+ Y
      d: w( j; D& P3 M
    - T3 x9 {( U: K# s6 y) A. ]/ L" I& s! e! D& h
    & D: Y$ E% h4 O/ [" \

    2 U% f9 E* C7 V# s" ~. ], O  L1 h/ R5 g' L: j$ l) R
    $ N4 e. d/ V  H

    ' r& j! R  x$ E9 P- p+ I' D12/21/2020更新; G# H! m4 ]( m: f6 K8 n  D
    本来计划12月25日就可以出差回来继续做这个工作,结果人算不如天算啊。年底了,公司派出去要账。其中江西的某公司人员一言不合就动手,而且是一帮人。我与另一个同事被打的头破血流,腿也断了,全身是伤,在别人的帮助下我们才得以脱身。现在我在医院躺着更新这个帖子。医生讲我应该在过年前能出院,到时候回家我再继续这个OCR的工作。给大家说一下情况,抱歉了诸位,让你们久等了。8 D) d6 I* `- ]2 s

    # n: |5 p7 Z( @8 B6 [12/06/2020更新
    7 e2 N- E2 Z0 _7 o) I1 ^' M! n, g2 h2 y& {$ ^* t  u
    我这一阵子出差了,暂时停滞没法继续,12月25日我会继续开始这个项目工作。; _" l' F% L4 ^) W5 y" u+ E

    - P" {) c4 q  O0 y1 u+ i1 ]所有人都已经完成自己的校对任务,我已经开始处理制作mdx。发现有三个人不看我的操作指导,不知道是怎么操作的,反正最后给我的HTML是从Word里导出的,导致这三个HTML的结构和其他人的HTML结构完全不一样,这样根本没法统一处理。现在已经联系这三个人,让他们发送当时校对的项目文件给我,我需要重新导出HTML。
    ) }1 s8 k" ?$ \/ O7 D
    ( E( l, b2 {; ~$ r' T0 y9 d从这件小事能看出来不管你做什么事情,工作中还是生活中,首先要了解清楚最终的需求!需求不清楚,你无论付出了多大努力都是不可能达到目标的。另外万不可自作聪明,觉得自己懂,就压根不去了解需求,这更是错上加错。
    ; I% W8 ~$ S+ c: p! h9 n( T
    1 e9 O( G/ d) {! l

    - F3 m5 t: E/ O( l5 I1 t" }7 g& T2 k5 Z4 k
    8 z7 k$ M0 Z+ p( ~7 \  g
    * _; H5 U. [* W- t0 `" b2 a$ I2 Z

    : ]3 Z6 Y7 [% G% j3 `( S$ q原帖内容; |+ x- u# B; k6 l! N; T8 ]& F

    & I1 Z( N: J6 `7 X. i7 y我想召集一些人共同校对OCR《英语常用词疑难用法手册第二版》的结果。具体细节如下:
    + C5 D9 [! j9 ^6 I- {, k, y- R5 d0 o) ~: C
    * 每人校对不超过60页5 U$ `. u3 {: K( b# N0 l8 z% {& D
    * 我提供软件(ABBYY FineReader)和校对方法,我会录制一个视频,大家必须按照视频里的操作来进行,保证每个人的操作都是一样的  x5 k, C# _$ ?
    * 我提供给每个人需要校对的PDF文件8 ^9 C* L" h; Y" `2 Y1 l
    * 参与校对的人最终可以获得我制作的mdx格式的词库
    . E) a& p' p- O* 参与者收到文件后一星期内必须完成任务(我测试了一下,ABBYY FineReader OCR的结果绝大多数都是正确的,校对一页大概需要10分钟左右吧)$ }1 M+ F7 N7 j! Q) @& l
    0 w* ~- w! l% @% `

    8 F% D0 V- f0 T0 p0 S没参与的人想要获得最终的mdx必须赞助,赞助的费用除掉我买书和找人扫描的成本外,剩余部分我会平均分给参与校对的朋友。2 N# m8 \' k( x

    ' q% b7 Y9 f2 Z, j8 v有意参加的人回帖表明或者给我发消息。
    . N! n1 |7 Z9 Z9 w9 C: Q; o: A; S3 n( S

    评分

    3

    查看全部评分

    本帖被以下淘专辑推荐:

  • TA的每日心情
    慵懒
    昨天 07:42
  • 签到天数: 1227 天

    [LV.10]以坛为家III

    发表于 2020-10-24 14:14:20 | 显示全部楼层
    不必等凑齐40人,每个人空余时间是不一样的。! E& _  k9 L7 c' F
    这两天刚好周末,现有的10多人可以开始先分配起来,校对出书的前四分之一。
  • TA的每日心情
    开心
    半小时前
  • 签到天数: 646 天

    [LV.9]以坛为家II

    发表于 2021-2-19 14:00:38 | 显示全部楼层
    谁能想到在一个以交流学习为目的的论坛还能看见这么一幕悲剧呢?虽然与您素昧平生,我很感激您组织起这么一次活动,从而让我学到一些诸如abbyy软件使用的知识和技巧。我觉得任何在没有现有数据可利用的情况下,以一己之力想要电子化书籍,特别是像词典百科全书或者冷门年代久远的书籍,都是功德无量的,愿上天保佑善良的您,也希望您有朝一日重拾英语。
  • TA的每日心情
    奋斗
    11 小时前
  • 签到天数: 480 天

    [LV.9]以坛为家II

    发表于 2020-12-21 15:11:32 | 显示全部楼层
    啊这……有些地方的民风的确是一言难尽# Z' T% F% Q* U* O1 A
    距离精神脱贫还很遥远
    3 o) z1 F3 v" I( V& u* k祝愿楼主能尽早恢复健康良好状态
  • TA的每日心情
    奋斗
    1 小时前
  • 签到天数: 617 天

    [LV.9]以坛为家II

    发表于 2021-2-18 08:53:53 | 显示全部楼层
    兄弟,还想着春节回来能听到你的好消息!既然现在已经这样了,安心养伤,多养养能恢复的,以后你继续用英语的日子还多着呢,保持良好心态,把伤养好,大家在论坛等着你健康回归!!
  • TA的每日心情
    慵懒
    昨天 07:42
  • 签到天数: 1227 天

    [LV.10]以坛为家III

    发表于 2020-11-2 17:36:36 | 显示全部楼层
    帮顶一下,希望更多朋友继续加入
  • TA的每日心情
    慵懒
    昨天 07:42
  • 签到天数: 1227 天

    [LV.10]以坛为家III

    发表于 2020-10-28 17:32:12 | 显示全部楼层
    并不是说所有情况都直接批量代换, Q8 C" U5 D4 U8 H, a+ r
    类似句号“。”被识别成了字母“o”,替换时采用逐个检索的方法,符合即替换
  • TA的每日心情
    无聊
    2021-1-15 05:13
  • 签到天数: 271 天

    [LV.8]以坛为家I

    发表于 2020-10-24 20:21:34 | 显示全部楼层
    报名参加!
    . W1 d) ]9 {& A% y- Q7 t0 k" ]: p8 o! S. R! G
    另: 小小的建议: 每个人的硬件环境 (Mac 上的 ABBYY 软件版本落后太多) 和电脑软件操作知识以及对教学视频内容理解的不一致, 依然有可能导致每个人交出的结果不能完全一致, 所以建议楼主看能不能把 ABBYY FineReader OCR 这部分统一完成了, 然后分发需要校对的内容大家根据要求完成, 这样估计报名的人会多一些而且完成质量可能会更好一些. / B  W6 u1 i2 r' M* w
    当然这只是个建议, 楼主作为发起人请自行定夺...

    点评

    谢谢支持!关键这个软件本身在校对这个步骤上能起到很大作用,所以最好是大家自己OCR自己的部分。Mac上我会随后测试一下看看有没有大的不通。  发表于 2020-10-24 20:43
  • TA的每日心情

    2020-11-5 07:56
  • 签到天数: 15 天

    [LV.4]偶尔看看III

    发表于 2020-10-23 23:01:07 | 显示全部楼层
    这个陈用仪的第二版,和第一版 内容上真的有区别么?还是出版社把完全同样的内容又出了一遍?

    点评

    有删有加,而且改了一些错误。我随便抽查了十个词条没有一个和第一版完全一样的。  发表于 2020-10-23 23:11
  • TA的每日心情
    奋斗
    2021-9-21 18:07
  • 签到天数: 167 天

    [LV.7]常住居民III

    发表于 2020-10-24 00:13:59 | 显示全部楼层
    有兴趣参与,先报名一个~

    点评

    好的,谢谢,咱们继续等等看能凑集40人不。  发表于 2020-10-24 00:56
  • TA的每日心情
    开心
    2020-10-25 06:08
  • 签到天数: 127 天

    [LV.7]常住居民III

    发表于 2020-10-24 08:56:02 | 显示全部楼层
    《英语常用词疑难用法手册》出第二版了,好书。报名参加。

    点评

    好的,谢谢,咱们继续等等看能凑集40人不。  发表于 2020-10-24 09:45

    该用户从未签到

    发表于 2020-10-24 09:33:26 | 显示全部楼层
    把我拉进来……25页可以说是非常轻松咯

    点评

    好的,谢谢,咱们继续等等看能凑集40人不。  发表于 2020-10-24 09:44
  • TA的每日心情
    开心
    2021-3-16 09:31
  • 签到天数: 41 天

    [LV.5]常住居民I

    发表于 2020-10-24 09:40:53 | 显示全部楼层
    25页大概需要多少小时核对
    , y" Q! R, m" a8 n( w6 ]

    点评

    大概4五个小时,这是估算哦。  发表于 2020-10-24 09:44
  • TA的每日心情
    奋斗
    1 小时前
  • 签到天数: 617 天

    [LV.9]以坛为家II

    发表于 2020-10-24 10:22:21 | 显示全部楼层
    从来没有干过这活,想参与一下,毕竟下了这么多好的资源,也该回馈一下,楼主,算我一个!一个小建议:人数不到40也可以开始,每个人多校对几页,能把好东西做出来最重要!

    点评

    好的,谢谢,咱们继续等等看能凑集40人不  发表于 2020-10-24 10:43
  • TA的每日心情
    慵懒
    昨天 07:42
  • 签到天数: 1227 天

    [LV.10]以坛为家III

    发表于 2020-10-24 13:47:31 | 显示全部楼层
    经典好书,报个名参加

    点评

    好的,谢谢,咱们继续等等看能凑集40人不  发表于 2020-10-24 13:53
  • TA的每日心情
    擦汗
    2021-11-10 19:44
  • 签到天数: 202 天

    [LV.7]常住居民III

    发表于 2020-10-24 16:38:11 | 显示全部楼层
    零基础小白,但也默默报个名。

    点评

    谢谢支持!  发表于 2020-10-24 17:24
  • TA的每日心情
    开心
    4 小时前
  • 签到天数: 1698 天

    [LV.Master]伴坛终老

    发表于 2020-10-24 17:26:12 | 显示全部楼层
    没用过ABBYY FineReader,零基础学习学习,报名参加。

    点评

    谢谢支持!  发表于 2020-10-24 17:28
  • TA的每日心情
    开心
    半小时前
  • 签到天数: 646 天

    [LV.9]以坛为家II

    发表于 2020-10-24 18:51:45 | 显示全部楼层
    报名参加,为好资源的诞生出自己的一份力

    点评

    谢谢支持!  发表于 2020-10-24 18:53
    谢谢????  发表于 2020-10-24 18:52
  • TA的每日心情
    开心
    2022-2-7 08:49
  • 签到天数: 243 天

    [LV.8]以坛为家I

    发表于 2020-10-24 21:09:49 | 显示全部楼层
    做图像切图版的如何呢?我愿意赞助
  • TA的每日心情
    开心
    2022-2-7 08:49
  • 签到天数: 243 天

    [LV.8]以坛为家I

    发表于 2020-10-24 21:10:03 | 显示全部楼层
    做图像切图版的如何呢?我愿意赞助
  • TA的每日心情
    开心
    11 小时前
  • 签到天数: 652 天

    [LV.9]以坛为家II

    发表于 2020-10-24 21:46:42 | 显示全部楼层

    # z8 |. r6 U+ [+ }报名参加,为好资源的诞生出自己的一份力; 另外,我已经买了这本书,值得做!
    ; _6 G& U# i5 x" I5 f1 m

    点评

    谢谢支持!  发表于 2020-10-24 22:29
  • TA的每日心情
    奋斗
    5 小时前
  • 签到天数: 811 天

    [LV.10]以坛为家III

    发表于 2020-10-25 15:12:26 | 显示全部楼层
    报名参加,几个小时还是能够挤出来的,希望早日成功。

    点评

    谢谢!  发表于 2020-10-25 16:09
  • TA的每日心情
    慵懒
    昨天 07:42
  • 签到天数: 1227 天

    [LV.10]以坛为家III

    发表于 2020-10-28 12:35:44 | 显示全部楼层
    如果对HTML代码、正则表达式很熟,可在OCR后导出html,然后直接用VSCode编辑html文件。
    # c1 Z3 M: z3 |. G+ R/ j% ~% U
    2 P8 m' H1 X& Y' D; |很多OCR错误是相同的,可以批量代换。
    7 N4 K9 S* a$ y0 W2 j2 |
    $ v3 s3 d: g6 L% Y9 q7 Z. EHTML标签正则替换后只需要很少几对就够用了,这样文件很小,校对时也比较清晰. Q! g3 P. [5 N% X) L& a2 i# @8 ^! e9 }
    <h3></h3>" X0 E3 T+ j! ~2 d, o0 V/ L
    <sup></sup>
    6 `! b) L7 n2 t) k" `<p></p>
    / \, U+ C# y4 r) c: a" f; S' r<b><i><u> </b></i></u>
    * F4 A7 `: _4 e. |<i></i>  D9 F. e$ H5 F. a5 E

    ! |. q2 @, b( Y5 l9 O例句和解说OCR并不是分得很清,可在所有校对完成时,  s7 R' H* e" M/ |
    自定义一个标签<exp></exp>去用正则判断+手工调整(用<span></span>也行)
    ) j+ I. R7 p" Y& f2 h% Q  O! f0 u* f
    7 |# b8 b0 |  [! |  M! z
  • TA的每日心情
    开心
    2019-6-23 00:02
  • 签到天数: 18 天

    [LV.4]偶尔看看III

     楼主| 发表于 2020-10-28 13:14:08 | 显示全部楼层
    huala 发表于 2020-10-28 12:350 E4 D5 `( J4 U. |
    如果对HTML代码、正则表达式很熟,可在OCR后导出html,然后直接用VSCode编辑html文件。' }1 d( J% b2 u5 q4 V7 _# ?

    " k6 U, j; H* K9 C! a很多OCR错误是相同 ...
    ) Z3 x% B, _6 p5 I% O; G
    你是说直接修改导出的HTML来校对么?在这里面批量替换不是很可靠,比如原始pdf中的一个句号“。”被识别成了字母“o”,没有办法找出所有的这种情况来批量替换的。至于这个校对软件生成的HTML那我肯定是要重度修改的,它生成太复杂。
  • TA的每日心情
    开心
    2019-6-23 00:02
  • 签到天数: 18 天

    [LV.4]偶尔看看III

     楼主| 发表于 2020-10-28 17:57:22 | 显示全部楼层
    huala 发表于 2020-10-28 17:32
    + G$ r- Y' ]0 p, q4 o! k$ }8 ^并不是说所有情况都直接批量代换
    . d) S2 H1 J5 X! J/ H; L类似句号“。”被识别成了字母“o”,替换时采用逐个检索的方法,符合即替 ...
    1 t; e( I! k" ]5 X' J; k
    那要把整个文件里的所有字母“o”都检查一边吗?这可能还不如用Abbyy帮助你把可能有问题的地方校对一下。我还只是举了一个例子,肯定还有其他情况,不可能手工把所有情况用肉眼观察“是否应该替换”的。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2022-6-29 12:06 , Processed in 0.066440 second(s), 11 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2020, Tencent Cloud.

    快速回复 返回顶部 返回列表