求图片转为词库的批量工具
网上许多词典有清晰的扫描版,可以像汉语大字典那样做成图片版。我的想法是这样的:将扫描版转换为图片,然后按词条切割成单个图片,图片命名为词条名,懂编程的哥们写个批量工具,将所有图片转为词库。虽然切割图片工作量也很大,但比起文字输入的工作量要小多了。
还有像书法字典,只能做成图片版。 1. 一词条一图片,图片文件名是词条的headword (工作到这里其实都可以结束了,可以用各种看图工具,比如这里http://tieba.baidu.com/p/2331683268 的【universale 万能图片词典查询器】);
2. tree /f >文件名,或者用其他文件管理工具,导出文件列表;
3. 简单操作(可以配用Excel),就得mdx的source 文本。
可以看看chigre的《汉意大词典》http://weibo.com/1144660915/ApqrPB7NL
http://ww3.sinaimg.cn/mw1024/443a23b3gw1ebzr1y2xkrj20sb0ea0w3.jpg
做这个工作,技术含量几乎为零,需要的是毅力、体力。
试一下,看看能不能成功 导出文本文件后怎么也做不好
页:
[1]