热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

requests实例

#爬取京东urltry:rrequests.get(url)r.raise_for_status()r.encodingr.apparent_encodingprint(r.t

# ===爬取京东
url = ''
try:r = requests.get(url)r.raise_for_status()r.encoding = r.apparent_encodingprint(r.text[:1000]) # 展示前一千字节的数据
except:print('爬取失败')# ===爬取亚马逊
url = ''
try:kv = {'user-agent':'Mozilla/5.0'}r = requests.get(url, headers=kv) # 浏览器伪装 Chrome/51.0.2704.63 Safari/537.36r.raise_for_status()r.encoding = r.apparent_encodingprint(r.text[1000:2000])
except:print('爬取失败')# ===百度搜索
# 百度的关键词接口: http://www.baidu.com/s?wd=keyword
keyword = 'python' # keyword即要搜索的词
try:kv = {'wd': keyword}r = requests.get('http://www.baidu.com/s', params=kv)print(r.request.url)r.raise_for_status()print(len(r.text)) # 输出返回文本的长度
except:print('爬取失败')# ===360搜索
# 360的关键词接口: http://www.so.com/s?q=keyword
keyword = 'python'
try:kv = {'q': keyword}r = requests.get('http://www.so.com/s', params=kv)print(r.request.url)r.raise_for_status()print(len(r.text)) # 输出返回文本的长度
except:print('爬取失败')# ===网络图片爬取
url = '' # 图片地址
root = 'D://PICS//' # 硬盘地址
path = root + url.split('/')[-1] # 硬盘地址+图片地址最后一个以 / 为分割的名字
try:if not os.path.exists(root):os.mkdir(root) # 数字模式创建目录if not os.path.exists(path):r = requests.get(url)with open(path, 'wb') as f:f.write(r.content)f.close()print('文件保存成功')else:print('文件已存在')
except:print('爬取失败')# ===IP地址查询
url = 'http://m.ip138.com/ip.asp?ip=ipaddress'
try:r = requests.get(url + 'IP')r.raise_for_status()r.encoding = r.apparent_encodingprint(r.text[-500:])
except:print('爬取失败')


推荐阅读
author-avatar
KeNnyT0nGMM_934
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有