只需一步,快速开始
该用户从未签到
gnoweb 发表于 2016-5-13 10:18. n0 |' o% I$ L, Y5 t$ E9 M) ` 1、修改 makefile (参考图片,修改成自己的 python 相关路径)9 `% u1 O2 u. s+ n9 u: E" W( h # q- z) S( `$ f4 `* O0 G) { 2、CMD 工作目录切换到代码所在目录,使 ...
举报
签到天数: 397 天
[LV.9]以坛为家II
tsiank 发表于 2016-5-13 11:32 # x; s) M2 s1 C) {还是自己先弄吧,自己做出来的字典可以自己做主,好的词典重复劳作的多了。我现在正用按键精灵处理呢,看 ...
wawxing 发表于 2016-5-13 07:58 ! C5 {0 f8 d9 f' ^% Z+ C' V. {在虚拟机中按键精灵。就能做其他事情了。
chigre3 发表于 2016-5-13 17:57 + z8 b- @$ n% i3 P0 |# G- V2 ?gnoweb 直接给出了方法 可以试试!!
chigre3 发表于 2016-5-13 18:17- l. \$ R# I: `7 r/ h7 X, j 看了下blog 提到了很多光盘原始数据的问题
coolsummer 发表于 2016-5-13 11:49 * n) E' {" y% o% X- dWFG 大的法子避开了解码资料库,直接取得光盘画面呈现的 HTML,应该最不会有资料错漏的问题。祝 tsiank ...
您需要 登录 才可以下载或查看,没有账号?免费注册
tsiank 发表于 2016-5-15 21:01: X% ?' Q, M3 E1 w r 初步完成,剩下的就是代码优化与排版的问题了。
tsiank 发表于 2016-5-15 21:01 4 w0 P7 I. l0 C" C: f' _ k* F初步完成,剩下的就是代码优化与排版的问题了。
chigre3 发表于 2016-5-16 17:435 E" L# f* p. ?, H2 h9 l 这样也好 可以对照blog说的数据条目数量对比一下
签到天数: 1 天
[LV.1]初来乍到
coolsummer 发表于 2016-5-17 16:41 1 z3 s+ y6 Y, f$ l& ~1 n4 I将tsiank大、gnoweb大贴出的撷取画面与WFG大的部落格相比对,两位的撷取似乎都没有部首、笔画、页码等资讯 ...
gnoweb 发表于 2016-5-17 16:070 e1 S6 c; H" Q8 u. O 又测试了一下,以 tsiank 提供的代码为基础,略作修改,能够完整提取 18014 个字目:
coolsummer 发表于 2016-5-17 16:41 & S' Y9 n2 _, A, g9 U) c将tsiank大、gnoweb大贴出的撷取画面与WFG大的部落格相比对,两位的撷取似乎都没有部首、笔画、页码等资讯 ...
liuyunrushui 发表于 2016-5-17 17:05 5 A/ J# S% q, {epwing的劣势就在于外字的处理以及色彩修饰,看到大大们的排版,赏心悦目!
tsiank 发表于 2016-5-18 01:54) l: a1 }( \% r4 O: z2 L 你这个才100多兆,我用按键精灵弄下来的文本都500多兆了。而且按键精灵提取的,有一百零几个词条竟然没有 ...
本版积分规则 发表回复 回帖后跳转到最后一页
小黑屋|手机版|Archiver|PDAWIKI |网站地图
GMT+8, 2025-7-9 08:19 , Processed in 0.022420 second(s), 17 queries .
Powered by Discuz! X3.4
© 2001-2023 Discuz! Team.