python模拟浏览器登录获取cookie_selenium3.7+python3添加cookie模拟登陆

作者：逝去似水流年 | 来源：互联网 | 2023-09-23 00:11

一、背景介绍最近做一个爬虫项目，用selenium调用浏览器去获取渲染后的源码，但是每次登陆都需要手机验证，这真的是头痛啊，

一、背景介绍

最近做一个爬虫项目&＃xff0c;用selenium调用浏览器去获取渲染后的源码&＃xff0c;但是每次登陆都需要手机验证&＃xff0c;这真的是头痛啊&＃xff0c;这种验证方式不要想着去破解&＃xff0c;还是老老实实用手机收验证码去吧&＃xff01;反正我是不知道这种验证方式还能破解&＃xff01;难道就没有其他办法了吗&＃xff1f;

有&＃xff0c;那就是模拟登陆&＃xff01;这样最起码不用没测试一次就登陆验证一次。

这里要说一下的就是&＃xff0c;网上很多关于webdriver 添加COOKIE的教程&＃xff0c;基本百分之80都是有问题的。反正我是找了N多的帖子都没有一个是正确的。

二、添加COOKIE方法&＃xff1a;driver.add_COOKIE()

1.add_COOKIE(COOKIE_dict)方法里面参数是COOKIE_dict&＃xff0c;说明里面参数是字典类型。

2.add_COOKIE源码。

从源码中我们可以看出&＃xff0c;add_COOKIE方法接受一个字典&＃xff0c;字典中包含name,value,path,domain,secure,expiry,但是这个源码容易误导人&＃xff0c;那就是COOKIE参数没有给全。

网上很多教程给的代码COOKIE参数是没给够的&＃xff0c;根本就跑不起来。

3. add_COOKIE接收的字典格式。

正确的格式&＃xff1a;

COOKIE &＃61; {

# "domain": ".58.com", #Firefox浏览器不能写domain,如果写了会报错&＃xff0c;谷歌需要写否则也是报错&＃xff0c;这里就是一个坑。其他浏览器没测试不知道情况。

&＃39;name&＃39;: name,

&＃39;value&＃39;: value,

"expires": "",

&＃39;path&＃39;: &＃39;/&＃39;,

&＃39;httpOnly&＃39;: False,

&＃39;HostOnly&＃39;: False,

&＃39;Secure&＃39;: False,

}

name&＃xff1a;COOKIE的名称

value&＃xff1a;COOKIE对应的值&＃xff0c;动态生成的

domain&＃xff1a;服务器域名

expiry&＃xff1a;COOKIE有效终止日期

path&＃xff1a;Path属性定义了Web服务器上哪些路径下的页面可获取服务器设置的COOKIE

httpOnly&＃xff1a;防脚本攻击

secure:在COOKIE中标记该变量&＃xff0c;表明只有当浏览器和Web Server之间的通信协议为加密认证协议时

为什么要构造成这样子&＃xff0c;其实我们看下浏览器保存的COOKIE格式就明白了。下图就是谷歌浏览器的COOKIE 的截图。

三 &＃xff0c;我们举个例子看下是否真的写成功了&＃xff1a;

第一次访问的的时候去获取名字叫hello的COOKIE 是没有的&＃xff0c;add_COOKIE后再去访问&＃xff0c;第二次访问就拿到了hello。说明已经写进去了。

四、项目实战。

能不能用&＃xff1f;好不好用&＃xff1f;怎么用&＃xff1f;&＃xff0c;用项目来说话&＃xff0c;模拟登陆百度。&＃xff01;

目标&＃xff1a;

1.手动登录一次后&＃xff0c;只要在COOKIE 有效期内无需重复登录。

2.访问浏览记录。

#!coding&＃61;utf-8

import time

from selenium import webdriver

import pickle

class BaiduSpider(object):

def __init__(self,username,password):

self.username &＃61; username

self.password &＃61; password

self.driver &＃61; webdriver.Chrome()

self.driver.get(url&＃61;&＃39;http://www.baidu.com&＃39;)

self.set_COOKIE()

self.is_login()

def is_login(self):

&＃39;&＃39;&＃39;判断当前是否登陆&＃39;&＃39;&＃39;

self.driver.refresh()

html &＃61; self.driver.page_source

if html.find(self.username) &＃61;&＃61; -1: #利用用户名判断是否登陆

# 没登录 ,则手动登录

self.login()

else:

#已经登录尝试访问搜索记录&＃xff0c;可以正常访问

self.driver.get(url&＃61;&＃39;http://i.baidu.com/my/history&＃39;)

time.sleep(30) # 延时看效果

def login(self):

&＃39;&＃39;&＃39;登陆&＃39;&＃39;&＃39;

time.sleep(60) #等待手动登录

self.driver.refresh()

self.save_COOKIE()

def save_COOKIE(self):

&＃39;&＃39;&＃39;保存COOKIE&＃39;&＃39;&＃39;

# 将COOKIE序列化保存下来

pickle.dump(self.driver.get_COOKIEs(), open("COOKIEs.pkl", "wb"))

def set_COOKIE(self):

&＃39;&＃39;&＃39;往浏览器添加COOKIE&＃39;&＃39;&＃39;

&＃39;&＃39;&＃39;利用pickle序列化后的COOKIE&＃39;&＃39;&＃39;

try:

COOKIEs &＃61; pickle.load(open("COOKIEs.pkl", "rb"))

for COOKIE in COOKIEs:

COOKIE_dict &＃61; {

"domain": ".baidu.com", # 火狐浏览器不用填写&＃xff0c;谷歌要需要

&＃39;name&＃39;: COOKIE.get(&＃39;name&＃39;),

&＃39;value&＃39;: COOKIE.get(&＃39;value&＃39;),

"expires": "",

&＃39;path&＃39;: &＃39;/&＃39;,

&＃39;httpOnly&＃39;: False,

&＃39;HostOnly&＃39;: False,

&＃39;Secure&＃39;: False}

self.driver.add_COOKIE(COOKIE_dict)

except Exception as e:

print(e)

if __name__ &＃61;&＃61; &＃39;__main__&＃39;:

BaiduSpider(&＃39;usename&＃39;,&＃39;!!!!&＃39;) # 你的百度账号&＃xff0c;密码

如果你支持我&＃xff0c;就扫扫我的红包&＃xff0c;你领我几毛&＃xff0c;我领几毛&＃xff0c;也算是对我的支持。

推荐阅读

server
如何使用mysql_nd：Python连接MySQL数据库的优雅指南

无论是进行机器学习、Web开发还是爬虫项目，数据库操作都是必不可少的一环。本文将详细介绍如何使用Python通过 `mysql_nd` 库与 MySQL 数据库进行高效连接和数据交互。内容涵盖以下几个方面： ... [详细]

蜡笔小新 2024-11-06 15:19:37
get
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
get
Django Admin 管理后台使用指南

本文详细介绍了如何在 Django 项目中使用 Admin 管理后台，包括创建超级用户、启动项目、管理数据模型和修改用户密码等步骤。 ... [详细]

蜡笔小新 2024-11-12 13:27:04
get
DVWA学习笔记系列：深入理解CSRF攻击机制

DVWA学习笔记系列：深入理解CSRF攻击机制 ... [详细]

蜡笔小新 2024-11-11 13:19:51
get
如何根据浏览器类型动态加载npm包以优化前端性能？

本文探讨了如何通过检测浏览器类型来动态加载特定的npm包，从而优化前端性能。具体而言，仅在用户使用Edge浏览器时加载相关包，以提升页面加载速度和整体用户体验。此外，文章还介绍了实现这一目标的技术细节和最佳实践，包括使用User-Agent字符串进行浏览器识别、条件加载策略以及性能监控方法。 ... [详细]

蜡笔小新 2024-11-06 13:30:57
get
Sanic框架下的高性能异步Web开发

Sanic 是一个类似于 Flask 的 Python 3.5 Web 服务器，以其出色的写入速度而著称。与 Flask 不同，Sanic 支持异步请求处理，这使得它在处理高并发请求时表现更加出色。通过利用 Python 的异步特性，Sanic 能够显著提高应用程序的性能和响应能力，适用于构建高性能的异步 Web 应用。 ... [详细]

蜡笔小新 2024-11-03 20:15:02
spring
如何使用Python高效绘制矩形图形

本文详细介绍了如何利用Python的Turtle库高效绘制矩形图形，适合初学者快速上手。通过具体示例代码，帮助读者理解Turtle库的基本绘图方法和技巧，同时探讨了在不同应用场景中绘制矩形的实际操作，为后续复杂图形的绘制打下坚实基础。 ... [详细]

蜡笔小新 2024-10-31 17:36:41
spring
软件测试工程师必备：全面解析Web应用的浏览器兼容性测试方法与工具

随着市场上浏览器种类的不断增多，特别是在平板和移动设备上的普及，确保网站在各种浏览器中都能正常运行变得尤为重要。本文将深入探讨Web应用的浏览器兼容性测试方法与工具，帮助软件测试工程师全面掌握这一关键技能，以提高应用的用户体验和可靠性。 ... [详细]

蜡笔小新 2024-10-31 07:56:54
js
深入解析浏览器内核与版本的发展历程

浏览器作为我们日常不可或缺的软件工具，其背后的运作机制却鲜为人知。本文将深入探讨浏览器内核及其版本的演变历程，帮助读者更好地理解这一关键技术组件，揭示其内部运作的奥秘。 ... [详细]

蜡笔小新 2024-11-11 13:34:37
get
Webdriver中元素定位的多种技术与策略

在Webdriver中，元素定位是自动化测试的关键环节。本文详细介绍了8种常用的元素定位技术与策略，包括ID、名称、标签名、类名、链接文本、部分链接文本、XPath和CSS选择器。每种方法都有其独特的优势和适用场景，通过合理选择和组合使用，可以显著提高测试脚本的稳定性和效率。此外，文章还探讨了在复杂页面结构中如何灵活运用这些定位技术，以应对各种挑战。 ... [详细]

蜡笔小新 2024-11-11 11:34:38
js
Ave V8 JavaScript 引擎：持续优化与创新

V8不仅是一款著名的八缸发动机，广泛应用于道奇Charger、宾利Continental GT和BossHoss摩托车中。自2008年以来，作为Chromium项目的一部分，V8 JavaScript引擎在性能优化和技术创新方面取得了显著进展。该引擎通过先进的编译技术和高效的垃圾回收机制，显著提升了JavaScript的执行效率，为现代Web应用提供了强大的支持。持续的优化和创新使得V8在处理复杂计算和大规模数据时表现更加出色，成为众多开发者和企业的首选。 ... [详细]

蜡笔小新 2024-11-09 15:56:40
get
Python 程序转换为 EXE 文件：详细解析 .py 脚本打包成独立可执行文件的方法与技巧

在开发了几个简单的爬虫 Python 程序后，我决定将其封装成独立的可执行文件以便于分发和使用。为了实现这一目标，首先需要解决的是如何将 Python 脚本转换为 EXE 文件。在这个过程中，我选择了 Qt 作为 GUI 框架，因为之前对此并不熟悉，希望通过这个项目进一步学习和掌握 Qt 的基本用法。本文将详细介绍从 .py 脚本到 EXE 文件的整个过程，包括所需工具、具体步骤以及常见问题的解决方案。 ... [详细]

蜡笔小新 2024-11-09 14:59:47
get
深入解析Ajax的工作机制及其在现代Web开发中的应用

本文深入探讨了Ajax的工作机制及其在现代Web开发中的应用。Ajax作为一种异步通信技术，改变了传统的客户端与服务器直接交互的模式。通过引入Ajax，客户端与服务器之间的通信变得更加高效和灵活。文章详细分析了Ajax的核心原理，包括XMLHttpRequest对象的使用、数据传输格式（如JSON和XML）以及事件处理机制。此外，还介绍了Ajax在提升用户体验、实现动态页面更新等方面的具体应用，并讨论了其在当前Web开发中的重要性和未来发展趋势。 ... [详细]

蜡笔小新 2024-11-07 14:11:10
get
从零开始使用Python Flask构建鱼书应用：高级编程指南

本课程详细介绍了如何使用Python Flask框架从零开始构建鱼书应用，涵盖高级编程技巧和实战项目。通过视频教学，学员将学习到Flask的高效用法，包括数据库事务处理和书籍交易模型的实现。特别感谢AI资源网提供的课程下载支持。 ... [详细]

蜡笔小新 2024-10-31 08:56:47
get
SQLmap自动化注入工具命令详解（第28-29天实战演练）

SQL注入工具如SQLMap等在网络安全测试中广泛应用。SQLMap是一款开源的自动化SQL注入工具，支持12种不同的数据库，具体支持的数据库类型可在其插件目录中查看。作为当前最强大的注入工具之一，SQLMap在实际应用中具有极高的效率和准确性。 ... [详细]

蜡笔小新 2024-10-30 11:16:15

逝去似水流年

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章