Pythonrequests库如何下载一个图片资源

作者：银仔-zxy | 来源：互联网 | 2023-09-05 15:16

原文地址https:blog.csdn.netu011541946articledetails77700074前面一篇文章介绍了response对象的一些常用API，

原文地址https://blog.csdn.net/u011541946/article/details/77700074

前面一篇文章介绍了response对象的一些常用API&＃xff0c;也已经提到&＃xff0c;我们的重点是对response对象的操作。主要的操作就是数据分析和提取&＃xff0c;一般来说&＃xff0c;数据有很多种&＃xff0c;有字段&＃xff0c;有图片&＃xff0c;有视频&＃xff0c;有音频&＃xff0c;凡是html页面能支持的content-type都是数据。只是不同场景下&＃xff0c;有不同目的。例如&＃xff0c;加入你需要在一个图片网站&＃xff0c;爬取一些你敢兴趣的图片。或者你需要在一些招聘网站爬取职位信息&＃xff0c;或者&＃xff0c;你需要从服务器端下载一个文件。这些事情requests都可以帮你做到。本文&＃xff0c;就是简单介绍&＃xff0c;如何从网页获取一个图片的过程。

1. 设置我们的场景

打开百度图片搜索&＃xff0c;输入selenium&＃xff0c;然后找到一个selenium的图片&＃xff0c;我们需要把这个图片通过requests下载到本地&＃xff0c;图片如下。

这里我们假如说要下载第一张图片。

2. 手动获取图片在服务器上的url

点击打开上面红圈这个图片&＃xff0c;记录下这个图片在服务器上的路径。你可以右键这个图片-查看图片&＃xff0c;获取到这个路径&＃xff1a;https://timgsa.baidu.com/timg?image&quality&＃61;80&size&＃61;b9999_10000&sec&＃61;1504662907&di&＃61;2bf9d214dfdc9b0243163fb0a20f1228&imgtype&＃61;jpg&er&＃61;1&src&＃61;http%3A%2F%2Fpic.baike.soso.com%2Fp%2F20140415%2Fbki-20140415104220-671149140.jpg

3. 利用requests.get()方法和response.content方法是否能够打印出图片

运行一下&＃xff0c;发现请求正确&＃xff0c;但是用response.content打印出来是一堆乱码。
200 OK
b&＃39;\xff\xd8\xff\xe0\x00\x10JFIF\x00\x01\x01\x01\x00H\x00H\x00\x00\xff\xd....后面跟着很多类似的乱码一样的数据

现在问题来了&＃xff0c;我们怎么样才能把图片下载到本地&＃xff0c;用response.content方法是行不通的。我们知道&＃xff0c;图片也是文件格式&＃xff0c;图片也是一些二进制代码组成。我们把图片当做普通的文件&＃xff0c;然后通过字节流的方法&＃xff0c;把图片保存到本地。

4.通过字节流方式保存图片

大概的原理是&＃xff0c;一个图片是由字节流数据组成&＃xff0c;我们可以把图片分层多个字节流数据&＃xff0c;加载到内存&＃xff0c;然后复制字节流到一个本地路径&＃xff0c;最后组合成一张图片。

import requestsdef download_image():url &＃61; &＃39;https://timgsa.baidu.com/timg?image&quality&＃61;80&size&＃61;b9999_10000&sec&＃61;1504068152047&di&＃61;8b53bf6b8e5deb64c8ac726e260091aa&imgtype&＃61;0&src&＃61;http%3A%2F%2Fpic.baike.soso.com%2Fp%2F20140415%2Fbki-20140415104220-671149140.jpg&＃39;response &＃61; requests.get(url, stream &＃61; True)# 这里打开一个空的png文件&＃xff0c;相当于创建一个空的txt文件,wb表示写文件with open(&＃39;selenium.png&＃39;, &＃39;wb&＃39;) as file:# 每128个流遍历一次for data in response.iter_content(128):# 把流写入到文件&＃xff0c;这个文件最后写入完成就是&＃xff0c;selenium.pngfile.write(data) # data相当于一块一块数据写入到我们的图片文件中print(response.status_code)if __name__ &＃61;&＃61; &＃39;__main__&＃39;:download_image()

运行之后&＃xff0c;得到请求状态码是200&＃xff0c;而且会在当前这个脚本文件同级目录下生成一个selenium.png的图片。如果你要指定图片保存路径&＃xff0c;你可以在open(&＃39;图片完整路径&＃39;,&＃39;wb&＃39;)&＃xff0c;通过这样方式&＃xff0c;把图片保存到你想要保存的磁盘路径。上面虽然实现了我们的下载图片的目的&＃xff0c;但是有一个问题就是&＃xff0c;我们使用完了stream之后&＃xff0c;没有立马去关闭&＃xff0c;这样会造成内存资源紧张&＃xff0c;如果是批量下载很多图片&＃xff0c;这个方式是不可取的。

5.换一种方式&＃xff0c;及时关闭stream

import requests
from contextlib import closingdef download_image_improve():url &＃61; &＃39;https://timgsa.baidu.com/timg?image&quality&＃61;80&size&＃61;b9999_10000&sec&＃61;1504068152047&di&＃61;8b53bf6b8e5deb64c8ac726e260091aa&imgtype&＃61;0&src&＃61;http%3A%2F%2Fpic.baike.soso.com%2Fp%2F20140415%2Fbki-20140415104220-671149140.jpg&＃39;response &＃61; requests.get(url, stream &＃61; True)with closing(requests.get(url, stream &＃61; True)) as response:# 这里打开一个空的png文件&＃xff0c;相当于创建一个空的txt文件,wb表示写文件with open(&＃39;selenium1.png&＃39;, &＃39;wb&＃39;) as file:# 每128个流遍历一次for data in response.iter_content(128):# 把流写入到文件&＃xff0c;这个文件最后写入完成就是&＃xff0c;selenium.png
file.write(data)if __name__ &＃61;&＃61; &＃39;__main__&＃39;:download_image_improve()

运行之后&＃xff0c;也会在当前脚本文件所在目录生成一个selenium1.png文件。contextlib.closing()函数是实现在一个代码块之后自动关闭&＃xff0c;这里的代码块&＃xff0c;就是我们请求下载图片的过程。这篇&＃xff0c;已经实现了限定的图片url下载&＃xff0c;如果是爬虫&＃xff0c;肯定是大量图片下载。上面图片下载可以提取出来&＃xff0c;重构成一个方法&＃xff0c;在实际爬虫中调用。当然&＃xff0c;爬虫中&＃xff0c;很多是变量&＃xff0c;图片请求url是变量&＃xff0c;图片名称和保存路径也是变量。这里不继续讨论&＃xff0c;爬虫实现的过程了。

转:https://www.cnblogs.com/111testing/p/10296342.html

推荐阅读

python
如何实现织梦DedeCms全站伪静态

本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态，以提高管理和SEO效果。全站伪静态可以避免重复URL的问题，同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式，可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具，如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]

蜡笔小新 2023-12-14 19:45:47
io
在重复造轮子的情况下用ProxyServlet反向代理来减少工作量

像不少公司内部不同团队都会自己研发自己工具产品，当各个产品逐渐成熟，到达了一定的发展瓶颈，同时每个产品都有着自己的入口，用户 ... [详细]

蜡笔小新 2023-12-13 15:19:01
header
Python瓦片图下载、合并、绘图、标记的代码示例

本文提供了Python瓦片图下载、合并、绘图、标记的代码示例，包括下载代码、多线程下载、图像处理等功能。通过参考geoserver，使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法，供读者参考使用。 ... [详细]

蜡笔小新 2023-12-13 12:14:55
config
网络请求模块选择——axios框架的基本使用和封装

本文介绍了选择网络请求模块axios的原因，以及axios框架的基本使用和封装方法。包括发送并发请求的演示，全局配置的设置，创建axios实例的方法，拦截器的使用，以及如何封装和请求响应劫持等内容。 ... [详细]

蜡笔小新 2023-12-12 10:16:43
config
分享css中提升优先级属性!important的用法总结

web前端|css教程css!importantweb前端-css教程本文分享css中提升优先级属性!important的用法总结微信门店展示源码,vscode如何管理站点,ubu ... [详细]

蜡笔小新 2023-12-11 11:25:16
window
【爬虫】关于企业信用信息公示系统加速乐最新反爬虫机制

(￣▽￣)~又得半夜修仙了，作为一个爬虫小白，花了3天时间写好的程序，才跑了一个月目标网站就更新了，是有点悲催，还是要只有一天的时间重构。升级后网站的层次结构并没有太多变化，表面上 ... [详细]

蜡笔小新 2023-10-17 19:24:48
python
Python 可视化 | Seaborn5 分钟入门 (六)——heatmap 热力图

微信公众号：「Python读财」如有问题或建议，请公众号留言Seaborn是基于matplotlib的Python可视化库。它提供了一个高级界面来绘制有吸引力的统计图形。Seabo ... [详细]

蜡笔小新 2023-10-17 17:48:15
io
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
python
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
io
Web学习历程记录（七）——Tomcat基本概念和配置

本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念，以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器，包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实，适合初学者了解Tomcat的基础知识。 ... [详细]

蜡笔小新 2023-12-13 17:08:24
python
Python连接服务器失败：使用aiohttp模拟服务器出现错误问题及解决方法

本文介绍了在使用Python中的aiohttp模块模拟服务器时出现的连接失败问题，并提供了相应的解决方法。文章中详细说明了出错的代码以及相关的软件版本和环境信息，同时也提到了相关的警告信息和函数的替代方案。通过阅读本文，读者可以了解到如何解决Python连接服务器失败的问题，并对aiohttp模块有更深入的了解。 ... [详细]

蜡笔小新 2023-12-13 12:37:59
io
MySQL语句大全：创建、授权、查询、修改等【MySQL】的使用方法详解

本文详细介绍了MySQL语句的使用方法，包括创建用户、授权、查询、修改等操作。通过连接MySQL数据库，可以使用命令创建用户，并指定该用户在哪个主机上可以登录。同时，还可以设置用户的登录密码。通过本文，您可以全面了解MySQL语句的使用方法。 ... [详细]

蜡笔小新 2023-12-11 15:34:14
io
Android实战——jsoup实现网络爬虫，糗事百科项目的起步

本文介绍了Android实战中使用jsoup实现网络爬虫的方法，以糗事百科项目为例。对于初学者来说，数据源的缺乏是做项目的最大烦恼之一。本文讲述了如何使用网络爬虫获取数据，并以糗事百科作为练手项目。同时，提到了使用jsoup需要结合前端基础知识，以及如果学过JS的话可以更轻松地使用该框架。 ... [详细]

蜡笔小新 2023-12-11 09:19:45
process
七月在线爬虫班学习笔记（七）——高级内容-并发编程

第七课主要内容：多进程多线程FIFO,LIFO,优先队列线程局部变量进程与线程的选择线程池异步IO概念及twisted案例股票数据抓取 ... [详细]

蜡笔小新 2023-10-17 20:16:36
process
用PHP连接MySQL代码的参数说明【PHP】

后端开发|php教程PHP,连接,MySQL,参数后端开发-php教程代码是这样的：大图标网站源码,怎么在vscode中调试css,ubuntu退出命令行,系统默认开tomcat, ... [详细]

蜡笔小新 2023-10-17 17:11:39

银仔-zxy

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章