2008yvaine 发表于 2015-9-28 03:13:54

多年前的waverley pictorial dictionary真的不错

这个waverley pictorial dictionary在译文论坛上评价也很不错,在archive.org载了8件套的全集,虽然是给学生用的词典,但是写得真心很好,如果可以转成MDX使用率肯定会大大增加,就是阅读起来也很有趣,虽然很古老

klwo2 发表于 2015-9-29 20:52:18

哈哈,这个倒是可以。

楼主看这里【图像版mdict字典制作方法 】:https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=13451

把djvu 花个几分钟转成图片,索引手动校对一下就好了。

我就是看了这个帖子入门的,嘿嘿。

2008yvaine 发表于 2015-9-30 04:48:54

是文字版的pdf的,不是完全图像版的

klwo2 发表于 2015-9-30 08:42:37

2008yvaine 发表于 2015-9-30 04:48
是文字版的pdf的,不是完全图像版的

文字版pdf就更簡單了啊!直接用文字做就好了嘛!

你要是還不會,把東西發到網盤上,這裏給個鏈接,一起教你做啦{:4_108:}

Oeasy 发表于 2015-9-30 13:01:53

2008yvaine 发表于 2015-9-30 04:48
是文字版的pdf的,不是完全图像版的


这个我还真研究过,要利用那 PDF 做出文字(含音标)准确、完美的 mdx ,难度相当于用煮好的茶叶蛋孵出小鸡来。

cracode 发表于 2015-9-30 16:18:19

Oeasy 发表于 2015-9-30 13:01
这个我还真研究过,要利用那 PDF 做出文字(含音标)准确、完美的 mdx ,难度相当于用煮好的茶叶蛋孵出 ...

深有体会。前几天试做 Roget's Super Thesaurus, 4th Edition,首先从PDF提取内容就困难重重。
pdftohtml、pdf2htmlEX、Pdflib TET、Solid Converter 提取的xml或html各有各的问题,最后还是 Adobe Reader 提取出 txt 自己加格式,但 PDF 里的 small caps 没法保留格式,导致释义和synonym混在一起,没法区分,只能放弃。

2008yvaine 发表于 2015-10-1 03:53:28

几位大神发声,看来真的难度太大,真能PDF看看了

dong959 发表于 2024-3-20 07:09:21

楼主,求资源,8卷的资源,谢谢
页: [1]
查看完整版本: 多年前的waverley pictorial dictionary真的不错