掌上百科 - PDAWIKI

用户名  找回密码
 免费注册

QQ登录

只需一步,快速开始

12
返回列表 发新帖
楼主: bt4baidu

[教程] 用一个简单的例子讲讲怎样从网站上扒数据

    [复制链接]

该用户从未签到

发表于 2016-5-1 03:21:33 | 显示全部楼层
赞楼主扫盲 希望有朝一日用得上

该用户从未签到

发表于 2016-5-2 08:18:44 来自手机 | 显示全部楼层
python确实挺实用的,有空得学学
  • TA的每日心情
    开心
    2018-11-8 16:40
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    发表于 2016-5-3 08:04:15 | 显示全部楼层
    先支持一下
    2 F( m1 K( {& ]/ u. r/ I: E

    该用户从未签到

    发表于 2016-5-3 15:37:13 | 显示全部楼层
    danke shoen. vielen Dank!

    该用户从未签到

    发表于 2016-5-16 18:10:45 | 显示全部楼层
    楼主发出来的代码好整洁! 学习耶
    ! d) v5 p0 k* j, V, ^" \
    / v2 g. e" \+ N8 P( _请教一下 26x26 字母的问题。能不能教教怎么捕获异常?提交上去的两个字母可能是没有的,比如 xx, 这样的话,怎么处理?
  • TA的每日心情
    擦汗
    2022-3-12 13:24
  • 签到天数: 4 天

    [LV.2]偶尔看看I

    发表于 2016-10-12 16:46:54 | 显示全部楼层
    bt4baidu 发表于 2014-6-29 23:27
    ( G/ D; Y3 A; ~" N9 D( G, u这种静态网页按我上面的说明毫无压力吧
    & q- o' i3 i! F; j/ ]7 h& c5 g比如http://www.nsii.org.cn/node/80/A/Acanthus/Acanthus%20leu ...
    : l0 I2 G8 O6 Z* S* x4 o0 W) W
    楼主问一下您的 wish list 上的 英语电子词典都找到了吗?
    3 I' Y6 H1 @2 P. V0 {$ S辛苦了+ X5 Y! C- i$ Z. a6 C
    如果找到了能不能也给我分享一下? 邮箱gzback@qq.com # a. @% J' G1 N0 t& c% z- R
    \thanks\a\lot\  :0
    % P5 b3 M6 o+ N' j5 `2 o. H:)

    该用户从未签到

    发表于 2017-10-6 13:12:24 | 显示全部楼层
    手把手的交,感谢大神给我等小白普及知识
  • TA的每日心情
    郁闷
    2017-10-18 00:48
  • 签到天数: 26 天

    [LV.4]偶尔看看III

    发表于 2017-10-18 14:58:12 | 显示全部楼层
    真的不簡單,很感謝版主無私的分享!!要慢慢琢磨一下了!!
  • TA的每日心情

    2019-1-17 01:42
  • 签到天数: 63 天

    [LV.6]常住居民II

    发表于 2017-12-9 21:12:28 | 显示全部楼层
    正需要这样的教程,谢谢了

    该用户从未签到

    发表于 2017-12-13 16:48:45 | 显示全部楼层
    Thanks alot my friend
  • TA的每日心情
    奋斗
    2023-7-15 17:18
  • 签到天数: 98 天

    [LV.6]常住居民II

    发表于 2017-12-22 10:16:39 | 显示全部楼层
    数据爬虫。。现在有很多可以参考用的工具了。。。
    7 f- ^6 ~; _+ \' O4 U, e" z# \3 O$ _& @- S6 y) g% N$ ^% V' [! u* V
    不过爬下来以后数据的整理是个头疼事情。有好的经验介绍?
  • TA的每日心情
    擦汗
    2018-5-10 22:38
  • 签到天数: 16 天

    [LV.4]偶尔看看III

    发表于 2018-4-14 06:49:05 | 显示全部楼层
    不错,路子正对,值得借鉴
  • TA的每日心情
    开心
    2019-8-7 16:33
  • 签到天数: 415 天

    [LV.9]以坛为家II

    发表于 2018-4-15 18:43:49 | 显示全部楼层
    也想搞点有技术含量的东西了,要向BT版努力学习
  • TA的每日心情
    开心
    2019-2-25 16:31
  • 签到天数: 13 天

    [LV.3]偶尔看看II

    发表于 2018-4-25 21:03:27 | 显示全部楼层
    学习一下,感谢
  • TA的每日心情
    开心
    2021-4-6 11:45
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    发表于 2018-5-19 12:25:21 | 显示全部楼层
    学习到了十分感谢
  • TA的每日心情
    奋斗
    2018-7-17 21:49
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2018-7-28 13:22:31 | 显示全部楼层
    首先,非常感謝樓主。
    4 Q3 B, w/ o; S& I* @& C6 g我獲得affix2.txt后,分別用MdxBuilder3.0、4.0X32、x64創建mdx,4.0版都沒問題,但3.0版總是創建失敗,3 d4 y! S; z* P" O1 v
    Done!
    + V; ~( g: s" ^/ L' d% xOriginal index size = 0KB, compressed size = 0KB, compression ratio = 314%
    * f! n( U* }. _5 n$ L* MTime used for this section: 0 seconds) _+ x8 U9 e" n
    Begin processing data contents...
    . @" @1 _) c$ c1 i- Z$ `9 }Failed to read from source file:C:\Users\frankly\Desktop\affix2.txt for record(line):1/ u4 T2 H$ D* I5 J
    Conversion failed!
    2 p; Y* A+ I1 o7 R0 u請各位指教,謝謝。

    该用户从未签到

    发表于 2019-4-4 14:12:57 | 显示全部楼层
    辛苦了 ,O(∩_∩)O谢谢
  • TA的每日心情
    奋斗
    2023-4-1 06:34
  • 签到天数: 1049 天

    [LV.10]以坛为家III

    发表于 2020-3-10 08:24:34 | 显示全部楼层
    太好了, 学到了很多。
  • TA的每日心情
    开心
    2023-5-27 07:43
  • 签到天数: 149 天

    [LV.7]常住居民III

    发表于 2020-3-10 17:24:06 | 显示全部楼层
    神一样的操作,说的就是楼主这样的高手!
  • TA的每日心情
    奋斗
    2024-10-16 18:17
  • 签到天数: 211 天

    [LV.7]常住居民III

    发表于 2020-3-11 21:17:26 | 显示全部楼层
    请问一下,怎样用脚本请求页面呢?我是完全的小白。
  • TA的每日心情
    开心
    2020-12-17 15:15
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    发表于 2020-11-26 13:02:34 | 显示全部楼层
    先留名,再说
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-24 13:07 , Processed in 0.022606 second(s), 17 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表