tsisrep 发表于 2018-10-30 23:17
请教下 双语对照制作有没有好的方法 之前做了一个 比较费劲
https://www.pdawiki.com/forum/forum.php?mo ...
哈哈哈,有意思,你这个思路比较好玩,不知道你是怎么嵌套的,能详细说说吗?
我来说说我以前怎么做中英逐行对照的
我是简单的把中英两个版本的正版电子书epub文件转txt,再把两个文本合并,最后打包回epub,方法很简单:
paste -d '\n' 1.txt 2.txt > 3.txt
前提是中英两个版本排版都没问题,因为以我有限的制作经验发现,英译中的过程起码在段落划分上都是很忠实于原著的,好像没有出现你说的某一个版本一行分三段的问题,即使有也很少,不知道你找的中英两个版本原始数据是不是都是正版没经过编辑
如果都是正版还出现大量这种情况,那。。。好像就只能“再创作”了,人工校对中英段落对照,那挺累啊
本帖最后由 tsisrep 于 2018-10-31 10:47 编辑
5dhtml 发表于 2018-10-31 09:49
哈哈哈,有意思,你这个思路比较好玩,不知道你是怎么嵌套的,能详细说说吗?
我来说说我以前怎么做中英 ...
我下的都是官方出版物,确实存在分段不一样,看了下主要是英文行文习惯与中文不一致,其实不一致的地方就不到5%,但是出现了就会上下文对不齐。比如中文200段 英文210段。
制作不费事,就是对齐耽误时间,给中文两边加上标签就可以弹注,手机不好写代码,你把我那个epub解开就可以看到中文两边的标签,用正则给中文加上就可以
你这个我也做了,但是还有些小问题
https://s1.ax1x.com/2018/10/31/iRrW5R.jpg
ps:其实你发的图片前两行中英文是不匹配的,这种情况我会手动调整中文去匹配英文,毕竟英文是原版。
能分享下你对齐的其他文本吗
tsisrep 发表于 2018-10-31 10:44
我下的都是官方出版物,确实存在分段不一样,看了下主要是英文行文习惯与中文不一致,其实不一致的地方就 ...
你意思是除了段落数不一致这种硬差异,还包括像我发的那种虽然段落一致但是翻译对应不上的情况?那你要求还是比较高的!
我觉得你这个思路非常好,我看逐行对照的时候中文干扰会很大,经常一着急就开始全看中文了,你这个创意很赞,就是校对比较费时间
不过这个时间成本你可以考虑在某个平台用提供服务的形式把它弥补回来 5dhtml 发表于 2018-10-31 10:57
你意思是除了段落数不一致这种硬差异,还包括像我发的那种虽然段落一致但是翻译对应不上的情况?那你要求 ...
自己做其实就是爱好,用来出售做一天回报估计是抵不上日薪的。
之前那本就是提出一种想法,希望能像mdx一样大家一起做一起分享,现在看来,反响一般。
要是有一个大v发起众筹 一章校对就是半小时的事,一本书就十几二十章,一人一两章一小时就能完成 制作不费时间,做好了之后内部分享比较好。
tsisrep 发表于 2018-10-31 13:34
自己做其实就是爱好,用来出售做一天回报估计是抵不上日薪的。
之前那本就是提出一种想法,希望能像mdx一 ...
我长时间的经验告诉我,阅读英文原著是一件非常非常小众的事情,有意愿的群体都很小,更何况付之行动的。
如果你找到一本网上长期找不到的词典数据需要大家一起校对那还差不多,因为感兴趣的人会很多,但还不能是little/pocket/mini词典,因为大家可能看不上,我在另一个帖子里发了个little oxford english dictionary,结果被坛里大佬讽刺:D Saxons 发表于 2018-10-30 19:07
你想制作个非常简洁的,我刚翻了一下手边的小词典,觉得韦氏的这本适合你,非常简洁:
再次感谢你的推荐,真的很精炼,正是我要找的!今天早上花了半个小时得到了这本辞典的数据,不过破解花了6个小时!
fearfare090807 发表于 2018-10-29 14:26
你的意思让人的确让人很困惑,好象是要个简单的词典,可是看上的 google dict 却是个超巨型的词典
换个 ...
这些天一直在想你说的,然后查了一些资料和项目,发现词干还原并不难,有各种现成的代码和工具可以直接用,但对于把释义内置到电子书里来说,每本书转换的计算量太大,因为书的数量是N,这个工作适合在开发阅读器的时候做,由阅读器在阅读时点击单词的时候还原词干,等于把计算量分散了,这才是科学的。这方面有现成的阅读器:iOS有个蒙哥原版阅读器,主打功能就是词频标记和单击释义,我是因为不想用iOS设备才自己做这个事的。然后回过头来我发现忽略了一个问题:我关注的核心是词频,而各大语料库现成的词频表不是按词干的词频排列的,而是统计排列自然语言的词频,已经包含了所有变形,这就让我松了一口气,这么说的话应该没问题了吧?
5dhtml 发表于 2018-10-31 16:24
再次感谢你的推荐,真的很精炼,正是我要找的!今天早上花了半个小时得到了这本辞典的数据,不过破解花了 ...
你破解的是APK吧。最近我想破解一个APK,看网上的教程看得一头雾水。
你能不能写个教程详细说明一下破解的过程,以及用到什么工具。
如果不方便公开,可以私下发消息告诉我。 Saxons 发表于 2018-11-16 07:49
你破解的是APK吧。最近我想破解一个APK,看网上的教程看得一头雾水。
你能不能写个教程详细说明一下破解 ...
我是去除amazon的电子书DRM保护,为了一本字典破解一个APK太不划算了吧,真能破解? 5dhtml 发表于 2018-11-16 21:16
我是去除amazon的电子书DRM保护,为了一本字典破解一个APK太不划算了吧,真能破解? ...
我有一本《我站在蚂蚁这一边》被加密了,看不了,你用什么软件去除DRM的? c:\eng\bak\1.jpg 5dhtml 发表于 2018-11-13 14:43
这些天一直在想你说的,然后查了一些资料和项目,发现词干还原并不难,有各种现成的代码和工具可以直接用 ...
个人经验:
1, coca2w人工筛除不认识的单词,弄出对应简单释义。
2, 用python把epub书里面,出现上述筛选单词加上释义。
3,用FBreader+anki划词助手阅读。
目的:
主要不想频繁的手动点击查词,遇到不懂的句子也可以翻译。(多看,中英掺杂有时不能翻译)
anki划词助手建立两个方案:添加、除去,用于步骤1的改进。
楼主可以看看 chambers
简洁的
chamber 释义非常简洁,用词简单
AHD5 释义较简洁,用词较难
word book 释义较简洁,用词简单,稍微带部分扩展
页:
1
[2]