只需一步,快速开始
该用户从未签到
gnoweb 发表于 2016-5-13 10:18" F. J: H1 [1 H! O( h 1、修改 makefile (参考图片,修改成自己的 python 相关路径)( Q, }5 \4 t, \# b7 Q% }( U5 e 9 s+ j2 K0 ?# \+ [$ a2、CMD 工作目录切换到代码所在目录,使 ...
举报
签到天数: 397 天
[LV.9]以坛为家II
tsiank 发表于 2016-5-13 11:32 ; ]2 l4 ^8 \7 r& L9 V- J5 y$ ]还是自己先弄吧,自己做出来的字典可以自己做主,好的词典重复劳作的多了。我现在正用按键精灵处理呢,看 ...
wawxing 发表于 2016-5-13 07:58 + ~6 O. j% _2 y- G$ L在虚拟机中按键精灵。就能做其他事情了。
chigre3 发表于 2016-5-13 17:57$ u5 [( y9 z+ b, |+ G& k3 S gnoweb 直接给出了方法 可以试试!!
chigre3 发表于 2016-5-13 18:17& K/ L6 |) c, W# W9 B& w 看了下blog 提到了很多光盘原始数据的问题
coolsummer 发表于 2016-5-13 11:491 g9 h' v5 K. f' V+ \9 q WFG 大的法子避开了解码资料库,直接取得光盘画面呈现的 HTML,应该最不会有资料错漏的问题。祝 tsiank ...
您需要 登录 才可以下载或查看,没有账号?免费注册
tsiank 发表于 2016-5-15 21:01+ b$ z {" S$ J# m N 初步完成,剩下的就是代码优化与排版的问题了。
tsiank 发表于 2016-5-15 21:01- m j; t5 c# E7 ?1 R 初步完成,剩下的就是代码优化与排版的问题了。
chigre3 发表于 2016-5-16 17:43 ( ?8 `7 m" q) u# f0 G" n: Q这样也好 可以对照blog说的数据条目数量对比一下
签到天数: 1 天
[LV.1]初来乍到
coolsummer 发表于 2016-5-17 16:41 # o2 @% E- }9 g; y+ h# `将tsiank大、gnoweb大贴出的撷取画面与WFG大的部落格相比对,两位的撷取似乎都没有部首、笔画、页码等资讯 ...
gnoweb 发表于 2016-5-17 16:07 1 \% ]% V4 W1 n$ K又测试了一下,以 tsiank 提供的代码为基础,略作修改,能够完整提取 18014 个字目:
coolsummer 发表于 2016-5-17 16:41 3 C2 i1 X: z& H+ |3 _2 r将tsiank大、gnoweb大贴出的撷取画面与WFG大的部落格相比对,两位的撷取似乎都没有部首、笔画、页码等资讯 ...
liuyunrushui 发表于 2016-5-17 17:058 j3 f7 S0 e6 o4 ^$ X7 F f, M% o epwing的劣势就在于外字的处理以及色彩修饰,看到大大们的排版,赏心悦目!
tsiank 发表于 2016-5-18 01:54/ [' n: J* S# [& \1 v( P1 ` 你这个才100多兆,我用按键精灵弄下来的文本都500多兆了。而且按键精灵提取的,有一百零几个词条竟然没有 ...
本版积分规则 发表回复 回帖后跳转到最后一页
小黑屋|手机版|Archiver|PDAWIKI |网站地图
GMT+8, 2026-6-5 03:22 , Processed in 0.020767 second(s), 16 queries .
Powered by Discuz! X3.4
© 2001-2023 Discuz! Team.