python爬虫cookie过期_python爬虫学习（六）requests关于cookie的堪误

作者：mr.sun | 来源：互联网 | 2023-08-27 15:08

Introducation本文修正了关于前段时间对于requests自动保存cookies和header的使用错误。requestspython有个库是requests࿰

Introducation

本文修正了关于前段时间对于requests自动保存COOKIEs和header的使用错误。

requests

python有个库是requests&＃xff0c;比更底层的urllib等更加方便简易。而且自带管理COOKIE&＃xff0c;headers等功能。

在python爬虫学习(四)获取COOKIE中&＃xff0c;简单介绍了获取COOKIE的方法&＃xff0c;而实际上&＃xff0c;requests会自动管理COOKIEs。

在通过requests get或者post网页之后&＃xff0c;如果是第一次访问某些页面&＃xff0c;在网页的response headers里会有set-COOKIEs的字段&＃xff0c;而requests会识别这些字段&＃xff0c;同时在接下来的get\post行为中&＃xff0c;自动添加这些COOKIEs。

检验

以访问百度为例&＃xff1a;

import requests

conn &＃61; requests.session()

resp &＃61; conn.get(&＃39;https://www.baidu.com/s?wd&＃61;findspace&＃39;)

# 打印请求的头

print(resp.request.headers)

# 打印结果如下&＃xff0c;requests已经自动填充了部分数据

# 再访问一次&＃xff1a;

resp &＃61; conn.get(&＃39;https://www.baidu.com/s?wd&＃61;findspace&＃39;)

print(resp.request.headers)

{&＃39;Connection&＃39;: &＃39;keep-alive&＃39;, &＃39;User-Agent&＃39;: &＃39;python-requests/2.4.3 CPython/3.4.2 Linux/3.16.0-4-amd64&＃39;, &＃39;Accept&＃39;: &＃39;*/*&＃39;, &＃39;COOKIE&＃39;: &＃39;BD_NOT_HTTPS&＃61;1; BDSVRTM&＃61;3; PSTM&＃61;1458389621; BIDUPSID&＃61;9CB03BE7D7F436EC2EE23C6E6EBE8EBD&＃39;, &＃39;Accept-Encoding&＃39;: &＃39;gzip, deflate&＃39;}

可以看到请求中已经自动加上了COOKIE&＃xff0c;但是也可以看到&＃xff0c;user-agent是&＃39;python-requests/2.4.3 CPython/3.4.2 Linux/3.16.0-4-amd64&＃39;&＃xff0c;可以通过前几篇中说的设置headers的方法来设置

headers &＃61; {

"method": "POST",

"scheme": "https",

"version": "HTTP/1.1",

"accept": "*/*",

"accept-encoding": "gzip, deflate",

"accept-language": "en-US,en;q&＃61;0.8,zh-CN;q&＃61;0.6,zh;q&＃61;0.4",

"content-type": "application/x-www-form-urlencoded;charset&＃61;UTF-8",

"dnt": "1",

"faces-request": "partial/ajax",

"origin": "https://www.baidu.com",

"referer": "https://www.baidu.com",

}

resp &＃61; conn.get(url, headers&＃61;headersm timeout&＃61;60)

注意此时的头会和requests填充的头相互补充&＃xff0c;但是用户自定义的头具有高优先级。比如&＃xff0c;你在headers里填充COOKIEs为自己的数据&＃xff0c;则在本次请求中会覆盖requests之前给你保存的COOKIEs。

也就不用像前文一样去手动保存COOKIE了。

推荐阅读

request
前端 Django那些以re开头的功能单词

Request对象和Response对象request:(请求)当一个页面被请求时，Django就会创建一个包含本次请求原信息的HttpRequest对象。Djang ... [详细]

蜡笔小新 2023-10-16 19:57:27
request
开发笔记:Java是如何读取和写入浏览器Cookies的

篇首语：本文由编程笔记#小编为大家整理，主要介绍了Java是如何读取和写入浏览器Cookies的相关的知识，希望对你有一定的参考价值。首先我 ... [详细]

蜡笔小新 2023-12-12 20:18:02
ip
Python SQLAlchemy库的使用方法详解

本文详细介绍了Python中使用SQLAlchemy库的方法。首先对SQLAlchemy进行了简介，包括其定义、适用的数据库类型等。然后讨论了SQLAlchemy提供的两种主要使用模式，即SQL表达式语言和ORM。针对不同的需求，给出了选择哪种模式的建议。最后，介绍了连接数据库的方法，包括创建SQLAlchemy引擎和执行SQL语句的接口。 ... [详细]

蜡笔小新 2023-12-12 15:23:06
request
AFNetworking、MKNetworkKit和ASIHTTPRequest比较

2019独角兽企业重金招聘Python工程师标准之前一直在使用ASIHTTPRequest作为网络库，但是由于其停止更新，iOS7上可能出现更多的 ... [详细]

蜡笔小新 2023-10-14 20:47:32
request
关于前端:解决参数依赖接口之间传递数据apipost

应用场景B接口申请参数依赖于A接口返回的数据，心愿B接口发送申请的时候能获取A接口返回的数据作为申请参数。实现思路将A接口返回的数据通过后执行脚本赋值给一个全局变量或者环境变量。具体示例咱们一个接口B须要A接口返回的参数token作为本人的申请参数。常见的场景如：拜访一个须要登陆能力浏览的接口。1、准 ... [详细]

蜡笔小新 2023-10-13 13:38:27
request
《How Tomcat Works》读书笔记（四）Tomcat Default Connector

为什么80%的码农都做不了架构师？上节《HowTomcatWorks》读书笔记（三），只是讲了一个简单的connect ... [详细]

蜡笔小新 2024-09-28 13:08:21
search
python爬取网页内容_python爬虫之获取页面script里面的内容

这是网页上的script我要获取的是00914这个数字直接使用正则表达式即可运行结果：源码：importrefrombs4importBeautif ... [详细]

蜡笔小新 2024-09-25 20:51:39
request
Day17_16_SpringCloud教程之Feign高级功能详解

Feign高级功能详解注意:本篇Feign的高级功能实现请参考上一篇博客.Feign的高级功能实现以上一篇博客代码为基础,我们主要修改service_feign_consume ... [详细]

蜡笔小新 2024-09-25 16:38:58
ip
python传数据给html页面,是否可以通过javascript或python（Flask）将文本文件中的数据打印到html页面？...

我得到了我的头围绕python和运行它关闭服务器(在这种情况下瓶)。基本上我试图打印本地文本文件的一些内容到一个HTML页面。我从用户那里获取一些输入值(名称，电子邮 ... [详细]

蜡笔小新 2024-09-25 13:03:50
eval
渗透测试基础bypass绕过阻挡我们的WAF（下）

渗透测试基础-bypass ... [详细]

蜡笔小新 2023-10-17 13:05:59
version
linux wget java,LINUX安装JDK1.8（wget方式）

找到JDK下载URL当然去官网找了。目前最新的1.8的下载URL(RPM)如下:http:download.oracle.comotn-pubjavajdk8u161-b122f3 ... [详细]

蜡笔小新 2023-10-17 12:01:02
version
常规反爬复习总结

一.常见基于身份识别进行反爬1通过headers字段来反爬headers中有很多字段，这些字段都有可能会被对方服务器拿过来进行判断是否为爬虫1.1通过headers中的User-A ... [详细]

蜡笔小新 2023-10-17 11:32:47
ip
djangoAjax发送POST请求csrf跨站请求的三种方式

第一种&amp;lt;script&amp;gt;$(&quot;.eq&quot;).on(&qu ... [详细]

蜡笔小新 2023-10-16 19:11:46
ip
SQLiLabs靶场的介绍、下载与安装

介绍SQLi-Labs是一个专业的SQL注入练习平台下面的测试场景都支持GET和POST两种注入方式：1.报错注入(联合查询)1)字符型2)数字型2.报错注入(基于 ... [详细]

蜡笔小新 2023-10-16 17:15:04
ip
Retrofit的使用与深入学习（下）

注意：以下分析都是基于Retrofit2转载请注明出处：http:blog.csdn.netevan_manarticledetails51320637本节是《Retrofit的使 ... [详细]

蜡笔小新 2023-10-16 14:46:54

mr.sun

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章