热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

requests实例

#爬取京东urltry:rrequests.get(url)r.raise_for_status()r.encodingr.apparent_encodingprint(r.t

# ===爬取京东
url = ''
try:r = requests.get(url)r.raise_for_status()r.encoding = r.apparent_encodingprint(r.text[:1000]) # 展示前一千字节的数据
except:print('爬取失败')# ===爬取亚马逊
url = ''
try:kv = {'user-agent':'Mozilla/5.0'}r = requests.get(url, headers=kv) # 浏览器伪装 Chrome/51.0.2704.63 Safari/537.36r.raise_for_status()r.encoding = r.apparent_encodingprint(r.text[1000:2000])
except:print('爬取失败')# ===百度搜索
# 百度的关键词接口: http://www.baidu.com/s?wd=keyword
keyword = 'python' # keyword即要搜索的词
try:kv = {'wd': keyword}r = requests.get('http://www.baidu.com/s', params=kv)print(r.request.url)r.raise_for_status()print(len(r.text)) # 输出返回文本的长度
except:print('爬取失败')# ===360搜索
# 360的关键词接口: http://www.so.com/s?q=keyword
keyword = 'python'
try:kv = {'q': keyword}r = requests.get('http://www.so.com/s', params=kv)print(r.request.url)r.raise_for_status()print(len(r.text)) # 输出返回文本的长度
except:print('爬取失败')# ===网络图片爬取
url = '' # 图片地址
root = 'D://PICS//' # 硬盘地址
path = root + url.split('/')[-1] # 硬盘地址+图片地址最后一个以 / 为分割的名字
try:if not os.path.exists(root):os.mkdir(root) # 数字模式创建目录if not os.path.exists(path):r = requests.get(url)with open(path, 'wb') as f:f.write(r.content)f.close()print('文件保存成功')else:print('文件已存在')
except:print('爬取失败')# ===IP地址查询
url = 'http://m.ip138.com/ip.asp?ip=ipaddress'
try:r = requests.get(url + 'IP')r.raise_for_status()r.encoding = r.apparent_encodingprint(r.text[-500:])
except:print('爬取失败')


推荐阅读
  • 本文介绍了如何使用JavaScript的Fetch API与Express服务器进行交互,涵盖了GET、POST、PUT和DELETE请求的实现,并展示了如何处理JSON响应。 ... [详细]
  • 本文探讨了为何相同的HTTP请求在两台不同操作系统(Windows与Ubuntu)的机器上会分别返回200 OK和429 Too Many Requests的状态码。我们将分析代码、环境差异及可能的影响因素。 ... [详细]
  • thereissomethingstrangeinmycode.Imsuretoforgetsomethingbutidontknowwhat.Itryto ... [详细]
  • 软件工程课堂测试2
    要做一个简单的保存网页界面,首先用jsp写出保存界面,本次界面比较简单,首先是三个提示语,后面是三个输入框,然 ... [详细]
  • 深入理解 .NET 中的中间件
    中间件是插入到应用程序请求处理管道中的组件,用于处理传入的HTTP请求和响应。它在ASP.NET Core中扮演着至关重要的角色,能够灵活地扩展和自定义应用程序的行为。 ... [详细]
  • 本文介绍如何使用 Angular 6 的 HttpClient 模块来获取 HTTP 响应头,包括代码示例和常见问题的解决方案。 ... [详细]
  • 实用正则表达式有哪些
    小编给大家分享一下实用正则表达式有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下 ... [详细]
  • 简化报表生成:EasyReport工具的全面解析
    本文详细介绍了EasyReport,一个易于使用的开源Web报表工具。该工具支持Hadoop、HBase及多种关系型数据库,能够将SQL查询结果转换为HTML表格,并提供Excel导出、图表显示和表头冻结等功能。 ... [详细]
  • 本文详细介绍如何使用 Python 集成微信支付的三种主要方式:Native 支付、APP 支付和 JSAPI 支付。每种方式适用于不同的应用场景,如 PC 网站、移动端应用和公众号内支付等。 ... [详细]
  • 远程过程调用(RPC)是一种允许客户端通过网络请求服务器执行特定功能的技术。它简化了分布式系统的交互,使开发者可以像调用本地函数一样调用远程服务,并获得返回结果。本文将深入探讨RPC的工作原理、发展历程及其在现代技术中的应用。 ... [详细]
  • 在寻找轻量级Ruby Web框架的过程中,您可能会遇到Sinatra和Ramaze。两者都以简洁、轻便著称,但它们之间存在一些关键区别。本文将探讨这些差异,并提供详细的分析,帮助您做出最佳选择。 ... [详细]
  • 本文介绍了如何利用Selenium和Python通过执行JavaScript代码来控制网页中的滚动条,包括垂直和水平滚动条的控制,以及特定元素的聚焦技术。 ... [详细]
  • Web App vs Native App:未来的移动应用趋势
    随着移动互联网的发展,Web App和Native App之间的竞争日益激烈。对于开发者而言,选择哪一种技术路径更为明智?本文将深入探讨两种应用模式的特点及未来趋势。 ... [详细]
  • 在开发过程中遇到前端页面显示 404 Not Found 错误时,通常意味着请求的资源无法被服务器找到。本文将探讨这一错误的具体原因及解决方法。 ... [详细]
  • 在进行微信小程序开发过程中,遇到了需要实现类似微信朋友圈那样的长文本折叠功能的需求。本文将详细探讨其实现方法及注意事项。 ... [详细]
author-avatar
KeNnyT0nGMM_934
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有