热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

验证码的识别的几种思路

验证码的识别随着时间的变换。进攻方与防守方的技术水平也在不断提高。简单来说就是一个无休止的拳击赛,你当唱罢我方登场。对于hardAI的研究完全没有任何价值。早期简单验证码的识别,大概思路

验证码的识别随着时间的变换。进攻方与防守方的技术水平也在不断提高。简单来说就是一个无休止的拳击赛,你当唱罢我方登场。对于hardAI的研究完全没有任何价值。

早期简单验证码的识别,大概思路是通过切割图片然后导入ocr图片识别技术。通过比较验证码的像素点。然后进行验证码的识别。不过随着时间的过度。简单的验证码已经无法从事于过度危险的网络环境。所以在形成了许多人类自己都难以辨识的的验证码。比如说各种各样的干扰线和扭曲。

google公司的验证码提供了验证码防御的一种很好的思路,通过扭曲验证码同时链接。可以很有效的阻止他人验证码的搜索。同时以往的切割验证码的识别对此的研究基本上没有太多的作用。所以可以视为一种安全的验证码。通过神经网络算法不断模拟该类验证码。在此类验证码的库有限的情况下。或许有20的可能性实现。

接着是讨论一种china gov网站大多数使用的不同颜色的验证码。可以通过提取色彩。比如说一个4位验证码。通过提取前五种颜色。然后hash到数组中。通过分辨rgb值分开来

形成新的图像,接着对图像进行读取并识别。在这个过程中需要在图像的位置上加一定标记。然后进行读取。(代码还没研究怎么贴。先发着。有机会把代码贴上去)

然后是12306的网站验证码破解。先是从12306上验证码验证识别框中。切出一定的区域。然后划分为8快。读取图片。传到百度识图的api接口。进行识别。然后识别出来的图片对12306的网站验证码输入。或者执行点击操作。

至于干扰线这种恶心人的验证码。本身人类就不号识别。如果使用图像腐蚀的话。对图像本身的形态结构造成改变。这种需要建立大规模的字库。对此种图像进行识别。而且成功率也仅有49%。

国外的CAPTCHA研究找到一个开源项目/。pwntcha。作者说看到那些卖验证码的太恶心。就把代码公开出来。他实现了许多简单验证码的实现。并对许多复杂验证码的弱点进行了提示。并且实现了许多验证码的高效识别。

链接:http://caca.zoy.org/wiki/PWNtcha

里面详细说明了验证码的识别。不过做这个没有太大的意义。因为以前上信息安全的课上。听老师说中国有那么多黑市。这些数据的获得。很多都可以通过黑客的移库进行操作。本来验证码的目的就是识别你是不是人类。为了保护网站的承载。你非要通过识别的这种手段,很有可能违反法律。更何况验证码识别的进攻方对防守方的实力差距不是一般的大。所以可以放弃这个没有太大利润的项目。





推荐阅读
  • 读手语图像识别论文笔记2
    文章目录一、前言二、笔记1.名词解释2.流程分析上一篇快速门:读手语图像识别论文笔记1(手语识别背景和方法)一、前言一句:“做完了&#x ... [详细]
  • 1.组合最优化问题定义:是通过数学方法的研究去寻找离散事件的最优编排、分组、次序或筛选等。描述:最优化问题的数学模型的一般描述是,x为决策 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 本文介绍了一些好用的搜索引擎的替代品,包括网盘搜索工具、百度网盘搜索引擎等。同时还介绍了一些笑话大全、GIF笑话图片、动态图等资源的搜索引擎。此外,还推荐了一些迅雷快传搜索和360云盘资源搜索的网盘搜索引擎。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 本文介绍了在使用Python中的aiohttp模块模拟服务器时出现的连接失败问题,并提供了相应的解决方法。文章中详细说明了出错的代码以及相关的软件版本和环境信息,同时也提到了相关的警告信息和函数的替代方案。通过阅读本文,读者可以了解到如何解决Python连接服务器失败的问题,并对aiohttp模块有更深入的了解。 ... [详细]
  • Whatsthedifferencebetweento_aandto_ary?to_a和to_ary有什么区别? ... [详细]
  • 本文介绍了一个适用于PHP应用快速接入TRX和TRC20数字资产的开发包,该开发包支持使用自有Tron区块链节点的应用场景,也支持基于Tron官方公共API服务的轻量级部署场景。提供的功能包括生成地址、验证地址、查询余额、交易转账、查询最新区块和查询交易信息等。详细信息可参考tron-php的Github地址:https://github.com/Fenguoz/tron-php。 ... [详细]
  • Sleuth+zipkin链路追踪SpringCloud微服务的解决方案
    在庞大的微服务群中,随着业务扩展,微服务个数增多,系统调用链路复杂化。Sleuth+zipkin是解决SpringCloud微服务定位和追踪的方案。通过TraceId将不同服务调用的日志串联起来,实现请求链路跟踪。通过Feign调用和Request传递TraceId,将整个调用链路的服务日志归组合并,提供定位和追踪的功能。 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • 如何使用PLEX播放组播、抓取信号源以及设置路由器
    本文介绍了如何使用PLEX播放组播、抓取信号源以及设置路由器。通过使用xTeve软件和M3U源,用户可以在PLEX上实现直播功能,并且可以自动匹配EPG信息和定时录制节目。同时,本文还提供了从华为itv盒子提取组播地址的方法以及如何在ASUS固件路由器上设置IPTV。在使用PLEX之前,建议先使用VLC测试是否可以正常播放UDPXY转发的iptv流。最后,本文还介绍了docker版xTeve的设置方法。 ... [详细]
  • cs231n Lecture 3 线性分类笔记(一)
    内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注:中文翻译 ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
author-avatar
fuxw
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有