只需一步,快速开始
该用户从未签到
gnoweb 发表于 2016-5-13 10:189 @& r4 d* s/ |9 D 1、修改 makefile (参考图片,修改成自己的 python 相关路径). n4 r0 z# `% J3 y+ J* W ! X) x2 |: Q$ V( v. W7 a% y5 x- D 2、CMD 工作目录切换到代码所在目录,使 ...
举报
签到天数: 397 天
[LV.9]以坛为家II
tsiank 发表于 2016-5-13 11:32 0 Z$ z/ Z1 [) q* D" P" Z* @还是自己先弄吧,自己做出来的字典可以自己做主,好的词典重复劳作的多了。我现在正用按键精灵处理呢,看 ...
wawxing 发表于 2016-5-13 07:584 |+ M" p/ Y+ w. }+ M; H 在虚拟机中按键精灵。就能做其他事情了。
chigre3 发表于 2016-5-13 17:57 e9 R4 E% ?. Q/ J gnoweb 直接给出了方法 可以试试!!
chigre3 发表于 2016-5-13 18:174 j+ ^- q. X o 看了下blog 提到了很多光盘原始数据的问题
coolsummer 发表于 2016-5-13 11:49* b, P; C6 N+ w% f6 c/ ? WFG 大的法子避开了解码资料库,直接取得光盘画面呈现的 HTML,应该最不会有资料错漏的问题。祝 tsiank ...
您需要 登录 才可以下载或查看,没有账号?免费注册
tsiank 发表于 2016-5-15 21:01 3 [8 X3 s+ j9 U: o, X! U, Z; Q初步完成,剩下的就是代码优化与排版的问题了。
tsiank 发表于 2016-5-15 21:01" d+ c0 V3 Z! Q4 A4 w; k, h 初步完成,剩下的就是代码优化与排版的问题了。
chigre3 发表于 2016-5-16 17:436 B0 k& P8 ] J4 E. e 这样也好 可以对照blog说的数据条目数量对比一下
签到天数: 1 天
[LV.1]初来乍到
coolsummer 发表于 2016-5-17 16:415 P4 u: N6 r' _3 M& A0 g6 N+ Q; ? 将tsiank大、gnoweb大贴出的撷取画面与WFG大的部落格相比对,两位的撷取似乎都没有部首、笔画、页码等资讯 ...
gnoweb 发表于 2016-5-17 16:07; U; u% d; M/ e; p8 N# I L 又测试了一下,以 tsiank 提供的代码为基础,略作修改,能够完整提取 18014 个字目:
coolsummer 发表于 2016-5-17 16:41' a w. @: Y" F0 @0 l7 Y 将tsiank大、gnoweb大贴出的撷取画面与WFG大的部落格相比对,两位的撷取似乎都没有部首、笔画、页码等资讯 ...
liuyunrushui 发表于 2016-5-17 17:05 & q. s/ m- B! a4 Y# z8 hepwing的劣势就在于外字的处理以及色彩修饰,看到大大们的排版,赏心悦目!
tsiank 发表于 2016-5-18 01:54 1 t1 y1 _" }6 L) B4 z$ ?9 Q你这个才100多兆,我用按键精灵弄下来的文本都500多兆了。而且按键精灵提取的,有一百零几个词条竟然没有 ...
本版积分规则 发表回复 回帖后跳转到最后一页
小黑屋|手机版|Archiver|PDAWIKI |网站地图
GMT+8, 2025-5-8 12:11 , Processed in 0.022088 second(s), 16 queries .
Powered by Discuz! X3.4
© 2001-2023 Discuz! Team.