python模拟登录获取cookie_python爬虫运用cookie模拟登录知乎

作者：编舞木煜率_841 | 来源：互联网 | 2023-09-07 10:07

前面已经介绍过，运用表单填写帐号，用户名的方式模拟登录知乎。若登录成功，则之后就可以利用cookie登入，无需重复之前步骤。

前面已经介绍过&＃xff0c;运用表单填写帐号&＃xff0c;用户名的方式模拟登录知乎。若登录成功&＃xff0c;则之后就可以利用COOKIE登入&＃xff0c;无需重复之前步骤。

importrequestsimporthttp.COOKIEjarfrom bs4 importBeautifulSoup

session&＃61;requests.Session()

session.COOKIEs&＃61; http.COOKIEjar.LWPCOOKIEJar("COOKIE")

agent&＃61; ‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Maxthon/5.1.2.3000 Chrome/55.0.2883.75 Safari/537.36‘headers&＃61;{"Host": "www.zhihu.com","Origin":"https://www.zhihu.com/","Referer":"http://www.zhihu.com/",‘User-Agent‘:agent

}

postdata&＃61;{‘password‘: ‘*******‘, #填写密码

‘account‘: ‘********‘, #填写帐号

}

response&＃61; session.get("https://www.zhihu.com", headers&＃61;headers)

soup&＃61; BeautifulSoup(response.content, "html.parser")

xsrf&＃61; soup.find(‘input‘, attrs&＃61;{"name": "_xsrf"}).get("value")

postdata[‘_xsrf‘] &＃61;xsrf

result&＃61; session.post(‘http://www.zhihu.com/login/email‘, data&＃61;postdata, headers&＃61;headers)

session.COOKIEs.save(ignore_discard&＃61;True, ignore_expires&＃61;True)

运行后&＃xff0c;在代码所在文件夹中出现COOKIE文件。

现在加载COOKIE登录&＃xff1a;

importrequestsimporthttp.COOKIEjar as COOKIElib

session&＃61;requests.session()

session.COOKIEs&＃61; COOKIElib.LWPCOOKIEJar(filename&＃61;‘COOKIE‘)try:

session.COOKIEs.load(ignore_discard&＃61;True)except:print("COOKIE 未能加载")defisLogin():

url&＃61; "https://www.zhihu.com/"login_code&＃61; session.get(url, headers&＃61;headers, allow_redirects&＃61;False).status_codeif login_code &＃61;&＃61; 200:returnTrueelse:returnFalseif __name__ &＃61;&＃61; ‘__main__‘:

agent&＃61; ‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Maxthon/5.1.2.3000 Chrome/55.0.2883.75 Safari/537.36‘headers&＃61;{"Host": "www.zhihu.com","Origin": "https://www.zhihu.com/","Referer": "http://www.zhihu.com/",‘User-Agent‘: agent

}ifisLogin():print(‘您已经登录‘)

运行后显示&＃xff1a;您已经登录。

COOKIElib模块的主要作用是提供可存储COOKIE的对象&＃xff0c;以便于requests模块配合使用来访问Internet资源。COOKIElib模块非常强大&＃xff0c;我们可以利用本模块的COOKIEJar类的对象来捕获COOKIE并在后续连接请求时重新发送&＃xff0c;比如可以实现模拟登录功能。该模块主要的对象有COOKIEJar、FileCOOKIEJar、MozillaCOOKIEJar、LWPCOOKIEJar。

它们的关系&＃xff1a;COOKIEJar —-派生—->FileCOOKIEJar —-派生—–>MozillaCOOKIEJar和LWPCOOKIEJar

默认的是FileCOOKIEJar没有实现save函数。

而MozillaCOOKIEJar或LWPCOOKIEJar都已经实现了。

所以可以用MozillaCOOKIEJar或LWPCOOKIEJar&＃xff0c;去自动实现COOKIE的save。

COOKIEJar

FileCOOKIEJar

/ \

MozillaCOOKIEJar LWPCOOKIEJar

推荐阅读

post
利用Requests库深入解析POST请求的发送方法与实践技巧

在前一篇文章中，我们介绍了如何使用Requests库发送GET请求。本文将深入探讨如何通过Requests库发送POST请求，包括参数格式、请求封装等关键技巧，并通过“历史上的今天”API实例进行详细说明。 ... [详细]

蜡笔小新 2024-10-27 15:02:24
post
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
object
DVWA学习笔记系列：深入理解CSRF攻击机制

DVWA学习笔记系列：深入理解CSRF攻击机制 ... [详细]

蜡笔小新 2024-11-11 13:19:51
select
网页图像抓取技术学习心得：从零开始掌握爬虫技巧

在今天的实践中，我深入学习了网页图像抓取技术，通过编写爬虫程序批量获取网站上的图片资源。具体来说，我选择了一个包含大量高质量图片的网站作为练习对象，并成功实现了将这些图片批量下载到本地存储。这一过程不仅提升了我对爬虫技术的理解，还增强了我的编程能力。 ... [详细]

蜡笔小新 2024-11-03 19:35:28
select
利用Python高效抓取微博文本与动态网页图像数据

本文介绍了使用 Python 编程语言高效抓取微博文本和动态网页图像数据的方法。通过详细的示例代码，展示了如何利用爬虫技术获取微博内容和动态图片，为数据采集和分析提供了实用的技术支持。对于对网络数据抓取感兴趣的读者，本文具有较高的参考价值。 ... [详细]

蜡笔小新 2024-10-31 14:48:38
import
可转债数据智能抓取与分析平台优化

本项目旨在优化可转债数据的智能抓取与分析平台。通过爬取集思录上的可转债信息（排除已发布赎回的债券），并结合安道全教授提出的三条安全线投资策略，新增了建仓线、加仓线和重仓线，以提供更精准的投资建议。 ... [详细]

蜡笔小新 2024-10-30 17:40:17
object
【Python爬虫实操】不创作小说，专精网站内容迁移，超高效！（含源代码）

本文详细介绍了如何利用Python爬虫技术实现高效网站内容迁移，涵盖前端、后端及Android相关知识点。通过具体实例和源代码，展示了如何精准抓取并迁移网站内容，适合对Python爬虫实战感兴趣的开发者参考。 ... [详细]

蜡笔小新 2024-10-28 20:00:28
object
HTML5 Web存储技术详解：从基础到应用全面解析

HTML5 Web存储技术是许多开发者青睐本地应用程序的重要原因之一，因为它能够实现在客户端本地存储数据。HTML5通过引入Web Storage API，使得Web应用程序能够在浏览器中高效地存储数据，从而提升了应用的性能和用户体验。相较于传统的Cookie机制，Web Storage不仅提供了更大的存储容量，还简化了数据管理和访问的方式。本文将从基础概念、关键技术到实际应用，全面解析HTML5 Web存储技术，帮助读者深入了解其工作原理和应用场景。 ... [详细]

蜡笔小新 2024-10-26 20:33:04
post
深入浅出解析HTTP协议的核心功能与应用

前言——协议是指预先设定的通信规则，确保双方能够按照既定标准进行有效沟通，从而实现准确的信息交换。例如，驯兽师通过拍手使动物坐下，这实际上是一种预设的协议。本文将详细探讨HTTP协议的核心功能及其广泛应用，解析其在现代网络通信中的重要作用。 ... [详细]

蜡笔小新 2024-10-26 18:47:54
post
探讨HTTP隧道技术在RDP暴力破解中的应用

本文介绍了如何利用HTTP隧道技术在受限网络环境中绕过IDS和防火墙等安全设备，实现RDP端口的暴力破解攻击。文章详细描述了部署过程、攻击实施及流量分析，旨在提升网络安全意识。 ... [详细]

蜡笔小新 2024-11-12 12:08:47
object
本地存储组件实现对IE低版本浏览器的兼容性支持

本地存储组件实现对IE低版本浏览器的兼容性支持 ... [详细]

蜡笔小新 2024-11-11 22:42:37
post
利用爬虫技术抓取数据，结合Fiddler与Postman在Chrome中的应用优化提交流程

本文探讨了如何利用爬虫技术抓取目标网站的数据，并结合Fiddler和Postman工具在Chrome浏览器中的应用，优化数据提交流程。通过详细的抓包分析和模拟提交，有效提升了数据抓取的效率和准确性。此外，文章还介绍了如何使用这些工具进行调试和优化，为开发者提供了实用的操作指南。 ... [详细]

蜡笔小新 2024-11-09 09:05:16
post
网页数据抓取与解析入门指南

本指南介绍了 `requests` 库的基本使用方法，详细解释了其七个主要函数。其中，`requests.request()` 是构建请求的基础方法，支持其他高级功能的实现。此外，我们还重点介绍了如何使用 `requests.get()` 方法来获取 HTML 网页内容，这是进行网页数据抓取和解析的重要步骤。通过这些基础方法，读者可以轻松上手并掌握网页数据抓取的核心技巧。 ... [详细]

蜡笔小新 2024-11-08 17:56:30
uri
技术日志：使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告

技术日志：使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告 ... [详细]

蜡笔小新 2024-11-07 14:33:19
post
深入解析HTTP网络请求API：从基础到进阶的全面指南

本文全面解析了HTTP网络请求API，从基础到进阶，详细介绍了Android平台上的两种原生API——HttpUrlConnection和HttpClient。这两种API通过对底层Socket的封装，提供了高效、灵活的网络通信功能。文章不仅涵盖了基本的使用方法，还深入探讨了性能优化、错误处理和安全性等方面的高级主题，帮助开发者更好地理解和应用这些工具。 ... [详细]

蜡笔小新 2024-11-06 15:30:57

编舞木煜率_841

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章