python+selenium+PIL+tesseract验证码识别

作者：_路過蓅颩_ | 来源：互联网 | 2023-09-09 00:49

一段简单的验证码识别，不过tesseract验证码识别很差，试了十几次只成功过两次，对结果不满意就当是学会一样新的技术吧1fromsele

一段简单的验证码识别&＃xff0c;不过tesseract验证码识别很差&＃xff0c;试了十几次只成功过两次&＃xff0c;对结果不满意就当是学会一样新的技术吧

1 from selenium import webdriver
2 from time import sleep
3 import unittest
4 from PIL import Image
5 from PIL import ImageEnhance
6 import pytesseract
7 driver&＃61;webdriver.Firefox()
8 url&＃61;"https://passport.baidu.com/?getpassindex"
9 driver.get(url)
10 driver.maximize_window()
11 driver.save_screenshot(r"E:\aa.png") #截取当前网页&＃xff0c;该网页有我们需要的验证码
12 imgelement &＃61; driver.find_element_by_xpath(".//*[&＃64;id&＃61;&＃39;forgotsel&＃39;]/div/div[3]/img")
13 #imgelement &＃61; driver.find_element_by_id("code") #定位验证码
14 location &＃61; imgelement.location #获取验证码x,y轴坐标
15 print (location)
16 size&＃61;imgelement.size #获取验证码的长宽
17 print(size)
18 coderange&＃61;(int(location[&＃39;x&＃39;]),int(location[&＃39;y&＃39;]),int(location[&＃39;x&＃39;]&＃43;size[&＃39;width&＃39;]),
19 int(location[&＃39;y&＃39;]&＃43;size[&＃39;height&＃39;])) #写成我们需要截取的位置坐标
20 i&＃61;Image.open(r"E:\aa.png") #打开截图
21 frame4&＃61;i.crop(coderange) #使用Image的crop函数&＃xff0c;从截图中再次截取我们需要的区域
22 frame4.save(r"E:\frame4.png")
23 i2&＃61;Image.open(r"E:\frame4.png")
24 imgry &＃61; i2.convert(&＃39;L&＃39;) #图像加强&＃xff0c;二值化&＃xff0c;PIL中有九种不同模式。分别为1&＃xff0c;L&＃xff0c;P&＃xff0c;RGB&＃xff0c;RGBA&＃xff0c;CMYK&＃xff0c;YCbCr&＃xff0c;I&＃xff0c;F。L为灰度图像
25 sharpness &＃61;ImageEnhance.Contrast(imgry)#对比度增强
26 i3 &＃61; sharpness.enhance(3.0) #3.0为图像的饱和度
27 i3.save("E:\\image_code.png")
28 i4&＃61;Image.open("E:\\image_code.png")
29 text&＃61;pytesseract.image_to_string(i4)#使用image_to_string识别验证码
30 print (text)

code

转:https://www.cnblogs.com/mtfan01/p/9077760.html

推荐阅读

list
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52
jsp
知识图谱——机器大脑中的知识库

本文介绍了知识图谱在机器大脑中的应用，以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例，说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案，如搜索关键词"Marie Curie"，会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革，不仅美国的微软必应，中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]

蜡笔小新 2023-12-14 10:06:19
list
Python瓦片图下载、合并、绘图、标记的代码示例

本文提供了Python瓦片图下载、合并、绘图、标记的代码示例，包括下载代码、多线程下载、图像处理等功能。通过参考geoserver，使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法，供读者参考使用。 ... [详细]

蜡笔小新 2023-12-13 12:14:55
list
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
rsa
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
jsp
求解hdu 1003 java题目的动态规划优化方法

本文讨论了如何优化解决hdu 1003 java题目的动态规划方法，通过分析加法规则和最大和的性质，提出了一种优化的思路。具体方法是，当从1加到n为负时，即sum(1,n)sum(n,s)，可以继续加法计算。同时，还考虑了两种特殊情况：都是负数的情况和有0的情况。最后，通过使用Scanner类来获取输入数据。 ... [详细]

蜡笔小新 2023-12-14 13:11:00
list
计算机网络初识及通信流程分析

本文介绍了计算机网络的定义和通信流程，包括客户端编译文件、二进制转换、三层路由设备等。同时，还介绍了计算机网络中常用的关键词，如MAC地址和IP地址。 ... [详细]

蜡笔小新 2023-12-13 16:50:29
list
Golang如何使用Cookie跟踪位置

关键词：Golang, Cookie, 跟踪位置, net/http/cookiejar, package main, golang.org/x/net/publicsuffix, io/ioutil, log, net/http, net/http/cookiejar ... [详细]

蜡笔小新 2023-12-13 15:47:22
io
在重复造轮子的情况下用ProxyServlet反向代理来减少工作量

像不少公司内部不同团队都会自己研发自己工具产品，当各个产品逐渐成熟，到达了一定的发展瓶颈，同时每个产品都有着自己的入口，用户 ... [详细]

蜡笔小新 2023-12-13 15:19:01
jsp
Java验证码——kaptcha的使用配置及样式

本文介绍了如何使用kaptcha库来实现Java验证码的配置和样式设置，包括pom.xml的依赖配置和web.xml中servlet的配置。 ... [详细]

蜡笔小新 2023-12-13 13:58:25
jsp
Day2列表、字典、集合操作详解

本文详细介绍了列表、字典、集合的操作方法，包括定义列表、访问列表元素、字符串操作、字典操作、集合操作、文件操作、字符编码与转码等内容。内容详实，适合初学者参考。 ... [详细]

蜡笔小新 2023-12-12 14:14:34
range
使用cacti监控mssql 2005运行资源情况的操作步骤

本文介绍了使用cacti监控mssql 2005运行资源情况的操作步骤，包括安装必要的工具和驱动，测试mssql的连接，配置监控脚本等。通过php连接mssql来获取SQL 2005性能计算器的值，实现对mssql的监控。详细的操作步骤和代码请参考附件。 ... [详细]

蜡笔小新 2023-12-12 13:57:58
list
MooTools和JQuery并排 - MooTools and JQuery Side by Side

IjustinheritedsomewebpageswhichusesMooTools.IneverusedMooTools.NowIneedtoaddsomef ... [详细]

蜡笔小新 2023-12-12 13:43:58
list
Python – 按地址在内存中引用对象

这是一个愚蠢的问题,但我只是对此感到好奇.假设我在Pythonshell,我有一些我查询的数据库对象.我做：db.query(的queryString)该查询在0xffdf842c ... [详细]

蜡笔小新 2023-12-12 13:28:00
range
基于dlib的人脸68特征点提取(眨眼张嘴检测)python版本

文章目录引言开发环境和库流程设计张嘴和闭眼的检测引言(1)利用Dlib官方训练好的模型“shape_predictor_68_face_landmarks.dat”进行68个点标定 ... [详细]

蜡笔小新 2023-12-12 13:27:42

_路過蓅颩_

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章