热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

爬取新浪首页图片

importurllibimporturllib2importreurlhttp:sports.sina.com.cngchampionsleaguelocal
import urllib
import urllib2
import re
url="http://sports.sina.com.cn/g/championsleague/"
local='C:\\img\\'
cnt=0
uaheaders={'User-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0'}
req=urllib2.Request("http://sports.sina.com.cn/g/championsleague/")
res=urllib2.urlopen(req)
pattern=re.compile(r'src="(.*?.png)"')
text=res.read()
print(text)
word=pattern.findall(text)
print(word)
for line in word:
    a=line.split('/')
    urllib.urlretrieve(line,local+a[-1])
    cnt+=1
print(cnt)
   
    


推荐阅读
author-avatar
ZQ我是疯癫小karmenRJ
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有