lzr80 发表于 2014-3-5 09:01:06

求图片转为词库的批量工具

网上许多词典有清晰的扫描版,可以像汉语大字典那样做成图片版。
我的想法是这样的:将扫描版转换为图片,然后按词条切割成单个图片,图片命名为词条名,懂编程的哥们写个批量工具,将所有图片转为词库。虽然切割图片工作量也很大,但比起文字输入的工作量要小多了。
还有像书法字典,只能做成图片版。

Oeasy 发表于 2014-3-5 10:05:08

1. 一词条一图片,图片文件名是词条的headword (工作到这里其实都可以结束了,可以用各种看图工具,比如这里http://tieba.baidu.com/p/2331683268 的【universale 万能图片词典查询器】);
2. tree /f >文件名,或者用其他文件管理工具,导出文件列表;
3. 简单操作(可以配用Excel),就得mdx的source 文本。


可以看看chigre的《汉意大词典》http://weibo.com/1144660915/ApqrPB7NL

http://ww3.sinaimg.cn/mw1024/443a23b3gw1ebzr1y2xkrj20sb0ea0w3.jpg


做这个工作,技术含量几乎为零,需要的是毅力、体力。

lzr80 发表于 2014-3-6 10:45:07

试一下,看看能不能成功

lzr80 发表于 2014-3-6 11:20:38

导出文本文件后怎么也做不好
页: [1]
查看完整版本: 求图片转为词库的批量工具