当前位置: 开发笔记 > 前端 > 正文

Node使用Selenium进行前端自动化操作的代码实现

作者：慕容春 | 来源：互联网 | 2022-08-27 02:08

这篇文章主要介绍了Node使用Selenium进行前端自动化操作的代码实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

前言：

最近项目中有类似的需求：需要对前端项目中某一个用户下的产品数据进行批量的处理。手动处理的流程大概是首先登录系统，获取到当前用户下的产品列表，点击产品列表的中产品项进入详情页，对该产品进行一系列的操作，然后保存退出。因为当前有20多万条数据，手动一条一条的处理不太现实，所以希望通过写脚本的方式来进行处理。

需求分析

其实这个需求还算比较简单，需要实现的点主要有三个，一是如何进行登录，获取登录信息，查询当前用户下的产品数据；二是如何知道当前数据是否处理完，然后退出当前的处理流程；三是如何异步的处理一批数据。

所以需要做的工作就是模拟登录，调用产品列表的查询接口获取产品ID集合，然后循环遍历当前的集合，通过产品ID跳转产品详情页面，模拟页面按钮的点击操作，监听处理完成的动作，退出当前的流程。

Selenium 介绍

What is Selenium&＃63;
Selenium automates browsers. That's it! What you do with that power is entirely up to you. Primarily, it is for automating web applications for testing purposes, but is certainly not limited to just that. Boring web-based administration tasks can (and should!) be automated as well.
Selenium has the support of some of the largest browser vendors who have taken (or are taking) steps to make Selenium a native part of their browser. It is also the core technology in countless other browser automation tools, APIs and frameworks.
翻译过来大致意思就是： Selenium 可以自动化操作浏览器。怎么去使用Selenium 的功能完全取决于我们自己。它主要还是使用在web应用的自动化测试上。但是他的功能并不仅限于此。那些枯燥的基于web的管理任务也可以自动化。很多流行的浏览器都采取了一些措施来支持Selenium实现本地化。它也是很多浏览器自动化工具、API自动化以及框架的核心技术。

Selenium 主要分 Selenium WebDriver 以及 Selenium IDE。我主要结合Node来介绍 Selenium WebDriver 的安装使用。本文主要介绍Selenium 结合 Node 的安装使用。需要进行深入研究的同学请自行查看官网文档。

Node 环境搭建

1. node的安装在此不再赘述。点击链接查看官网下载安装方法。
2. express安装

$ npx express-generator

或者

$ npm install -g express-generator

创建项目：

$ express --view=ejs selenium-start
$ cd selenium-start
$ yarn

启动项目：

$ DEBUG=myapp:* yarn start

至此，Node 项目创建完毕。接下来我们就可以在项目中集成Selenium WebDriver

Selenium WebDriver 集成

1. 安装selenium-webdriver

yarn add selenium-webdriver

2. 下载安装支持不同浏览器的驱动。（此处只介绍Chrome驱动）

[ChromeDriver][3]
下载并解压文件，同时把解压的执行文件放置到 /usr/bin目录下。或者设置相应的PATH路径，确保可执行文件在PATH路径中。

开始使用

进入我们刚才创建的项目文件夹，目录如下：

页面添加一个开始按钮，以及给按钮添加事件。

找到 views/index.ejs, 添加如下代码：(为了方便操作，引入了jquery, axios, 所以需要下载准备好)

添加对应的路由

在app.js文件中，引入路由chromeDriver

 var chromeDriverRouter = require('./routes/chromeDriver');
 app.use('/chromeDriver', chromeDriverRouter);

引入selenium-webdriver

在routes/chromeDirver.js文件中，我们添加了一个方法handleBaiDuDriver，这个方法用于处理模拟百度搜索自动化的一些测试。

首先我们需要在文件顶部引入selenium-webdriver

 const {Builder, By, Key, until} = require('selenium-webdriver');

 // Builder: 用于创建一个WebDriver实例。
 // By: 表示通过什么方式来查找页面的元素。
   // By.className( name ) → By
   // By.css( selector ) → By
   // By.id( id ) → By
   // By.js( script, ...var_args ) → function(WebDriver): Promise
   // By.linkText( text ) → By
   // By.name( name ) → By
   // By.partialLinkText( text ) → By
 // Key: 表示键盘上一系列的按键。
 // until： 定义了一些工具类的方法。

然后书写我们的方法体里的内容。

const handleBaiDuDriver = async () => {
   let driver = await new Builder().forBrowser('chrome').build();
   try {
     await driver.get('http://www.baidu.com');
 
     await driver.findElement(By.id('kw')).sendKeys('webdriver', Key.RETURN);//正常使用
 
     await driver.findElement(By.id('su')).click();
 
     await driver.wait(until.titleIs('百度一下，你就知道'), 1000);
     
   } catch (error) {
     console.log(error)
   } finally {
     await driver.sleep(2000);
     await driver.quit();
   }
 }

启动服务，查看效果。

启动服务之后，我梦能看到如下的界面。

点击页面中的【点击开始】按钮，最终能够看到如下的界面，为了演示我做了两秒的延迟。生成的gif图有9M多，无法上传。后续可以下载源码运行看效果。

获取登录信息

以上是selenium-webdriver的简单集成。在之前我们提到过实际需求中如何获取登录信息的问题。在访问产品列表页面的时候需要进行登录校验。如果没有登录则会跳转界面。由于我们的登录页是通过iframe来嵌套引入的。由于暂时还没有了解如何处理iframe里的操作，所以没法去模拟用户名密码的输入。

查看API文档，WebDriver 会有一个manage方法：

this.manage() → Options

该方法会返回一个Options实例，具有如下的方法：

其中有对COOKIE的操作方法。所以可以通过首次输入用户信息并进行缓存的方式来实现登录态的保存。在下一次再打开页面的时候直接从缓存里获取COOKIE信息，并通过addCOOKIE方法进行COOKIE的设置。但是由于我不知道什么时候、多长时间登录才会成功，所以在获取COOKIE的时候需要通过不断循环的方式去获取，直到拿到COOKIE。当然可以设置一个超时时间。超时之后就退出当前driver。

 
 // 缓存COOKIE
 async function setCOOKIEs(driver) {
   const manage = driver.manage();
   let sleepTime = 6000;
   await driver.sleep(sleepTime);
   let COOKIEs = null
   try {
     COOKIEs = await manage.getCOOKIEs();  
   } catch (error) {
   }
   while (!COOKIEs || !findSessionIdFromCOOKIEs(COOKIEs)) {
     await driver.sleep(2000)
     sleepTime += 2000;
     try {
       COOKIEs = await manage.getCOOKIEs();
     } catch (error) {
     }
   }
   if (COOKIEs && findSessionIdFromCOOKIEs(COOKIEs)) {
     cache.COOKIEs = COOKIEs; // cache是全局用于缓存COOKIE的对象
     cache.COOKIEsStr = cache.COOKIEs.map((COOKIE) => {
       return `${COOKIE.name}=${COOKIE.value}`
     }).join(';');
   }
   return COOKIEs;
 }
 
 
 // 设置COOKIE
 async function initCOOKIEs(driver) {
   const COOKIEs = cache.COOKIEs;
   if (COOKIEs && COOKIEs.length > 0) {
     await driver.manage().deleteAllCOOKIEs();
     for (let i = 0 ; i

获取到COOKIE 信息之后就可以请求产品列表以及通过产品ID进入产品详情页。然后再模拟页面按钮点击操作即可。

Github地址

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

推荐阅读

view
2019年前端技术趋势及职业发展路径

本文探讨了2019年前端技术的发展趋势，包括工具化、配置化和泛前端化等方面，并提供了详细的学习路线和职业规划建议。 ... [详细]

蜡笔小新 2024-12-19 10:19:35
vue
Vue 开发与调试工具指南

本文介绍了如何使用 Vue 调试工具，包括克隆仓库、安装依赖包、构建项目以及在 Chrome 浏览器中加载扩展的详细步骤。 ... [详细]

蜡笔小新 2024-12-20 16:28:04
console
JavaScript 实战与基础案例解析

本文介绍了多个关于JavaScript的书籍资源、实用工具和编程实例，涵盖从入门到进阶的各个阶段，帮助读者全面提升JavaScript编程能力。 ... [详细]

蜡笔小新 2024-12-24 16:36:52
css
解决Selenium浏览器实例化位置导致的闪退问题

本文探讨了在使用Selenium进行自动化测试时，由于webdriver对象实例化位置不同而导致浏览器闪退的问题，并提供了详细的代码示例和解决方案。 ... [详细]

蜡笔小新 2024-12-23 16:09:49
css
如何清除Chrome浏览器地址栏的特定历史记录

在使用Chrome浏览器时，你可能会发现地址栏保存了大量浏览记录。有时你可能希望删除某些特定的历史记录而不影响其他数据。本文将详细介绍如何单独删除地址栏中的特定记录以及批量清除所有历史记录的方法。 ... [详细]

蜡笔小新 2024-12-22 17:14:01
react
基于Node.js、Express、MongoDB和Socket.io的实时聊天应用开发

本文详细介绍了使用Node.js、Express、MongoDB和Socket.io构建的实时聊天应用程序。涵盖项目结构、技术栈选择及关键依赖项的配置。 ... [详细]

蜡笔小新 2024-12-22 15:31:28
css
利用Selenium与ChromeDriver实现豆瓣网页全屏截图

本文介绍了一种使用Selenium和ChromeDriver结合Python代码，轻松实现对豆瓣网站进行完整页面截图的方法。该方法不仅简单易行，而且解决了新版Selenium不再支持PhantomJS的问题。 ... [详细]

蜡笔小新 2024-12-22 15:17:55
css
Python自动化测试入门：Selenium环境搭建

本文详细介绍如何在Python环境中安装和配置Selenium，包括开发工具PyCharm的安装、Python环境的设置以及Selenium包的安装方法。此外，还提供了编写和运行第一个自动化测试脚本的步骤。 ... [详细]

蜡笔小新 2024-12-21 10:48:56
jquery
Spring Boot 中静态资源映射详解

本文深入探讨了 Spring Boot 如何简化 Web 应用中的静态资源管理，包括默认的静态资源映射规则、WebJars 的使用以及静态首页的处理方法。通过本文，您将了解如何高效地管理和引用静态资源。 ... [详细]

蜡笔小新 2024-12-20 20:02:31
webkit
一个登陆界面

预览截图html部分123456789101112用户登入1314邮箱名称邮箱为空15密码密码为空16登 ... [详细]

蜡笔小新 2024-12-20 09:57:07
css
Linux 系统启动故障排除指南：MBR 和 GRUB 问题

本文详细介绍了 Linux 系统启动过程中常见的 MBR 扇区和 GRUB 引导程序故障及其解决方案，涵盖从备份、模拟故障到恢复的具体步骤。 ... [详细]

蜡笔小新 2024-12-27 20:40:29
webkit
如何高效创建和使用字体图标

在Web和移动开发中，为什么选择字体图标？主要原因是其卓越的性能，可以显著减少HTTP请求并优化页面加载速度。本文详细介绍了从设计到应用的字体图标制作流程，并提供了专业建议。 ... [详细]

蜡笔小新 2024-12-26 20:48:44
css
启动MySQL服务的命令行步骤

本文详细介绍了如何通过命令行启动MySQL服务，包括打开命令提示符窗口、进入MySQL的bin目录、输入正确的连接命令以及注意事项。文中还提供了更多相关命令的资源链接。 ... [详细]

蜡笔小新 2024-12-26 20:16:36
jquery
根据条件动态控制文件选择文本的显示

本文讨论了如何根据特定条件动态显示或隐藏文件上传控件中的默认文本（如“未选择文件”）。通过结合CSS和JavaScript，可以实现更灵活的用户界面。 ... [详细]

蜡笔小新 2024-12-26 15:45:21
console
JavaScript中style、currentStyle、getComputedStyle及getBoundingClientRect的使用与区别

本文详细探讨了JavaScript中四种获取CSS样式的不同方法：style、currentStyle、getComputedStyle和getBoundingClientRect。每种方法的适用场景及其兼容性问题，并提供了解决方案。 ... [详细]

蜡笔小新 2024-12-18 19:27:53

慕容春

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章