掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 941|回复: 4

[求助] 如何抓取网页,自己制作词典?

[复制链接]

该用户从未签到

发表于 2016-5-31 10:57:49 | 显示全部楼层 |阅读模式
想自己做个词典,请问如何抓取网页并转换格式,没有找到详细的教程。

该用户从未签到

发表于 2016-5-31 11:16:44 | 显示全部楼层
[索引] 【史上最全】在线词典抓取、制作技术汇总% g5 c  s  O1 g8 a+ x
https://www.pdawiki.com/forum/fo ... hread&tid=13219

该用户从未签到

发表于 2016-6-1 11:00:56 | 显示全部楼层
1. 找出网址规律
: [+ {/ X/ t2 i2. 爬虫下载网页7 X) |5 ]0 b& s( |+ J
3. 正则表达式提取需要的内容
2 R9 v) C* m- M3 Z/ S* Q1 ?9 j. ]" [% P, r
现在很多网站有反采集措施,需要用代理换IP等

该用户从未签到

发表于 2016-6-3 10:24:25 | 显示全部楼层
想做飯,請問如何炒菜做飯。
7 u# r( S0 V; P6 k想成功,請問如何成功。
% x2 [& ~' z$ [6 z8 Y8 L" x
/ X! s6 Q, m0 c& t2 ~: I建議 po 主提問更加有針對性一些,否則也就只能告訴你「找出規律、抓取數據、抽出內容」,實際不懂的還是不懂。

点评

现在不动脑筋就伸手的人太多了,总想着别人能喂到他嘴里。然而如果告诉他“自己动手动脑”时,又会有某委员不服,并上来批判一番。  发表于 2016-6-3 11:32
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2025-5-8 12:45 , Processed in 0.019699 second(s), 22 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表