注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

c32's blog

每天学习一点点,每天进步一点点.

 
 
 
 
 

日志

 
 

python爬虫测试  

2016-08-04 20:32:48|  分类: Python |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Author  : c32 (amd5@qq.com)
# @Blog    : http://cx7863.blog.163.com/
# @Version : 
# @DateTime:  2016-08-04 20:25:30
import urllib
import string
url = 'http://www.freebuf.com/articles'
globalcontent = urllib.urlopen(url).read()
news_start = globalcontent

count = 1
while count <= 16:
    try:
        news_inner_head = news_start.find('<dt><a href=')
        news_inner_tail = news_start.find('.html')
        news_inner_url = new_start[news_inner_head+13:news_inner_tail+5]
        print news_inner_url
        news_start = news_start[news_inner_tail+5:]
        
        filename = news_inner_url[-10:]
        urllib.urlretrieve(news_inner_url,filename)
        count += 1
    except:
        print 'Download Success!'
    finally:
        if count == 16:
            break



        

  评论这张
 
阅读(20)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017