热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

请求十个ip地址

importreimportlxml.htmlimportrequestsfromfake_useragentimportUserAgentencodercharsABCDE

import reimport lxml.html
import requests
from fake_useragent import UserAgentencoderchars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/="#用python重写生成session的算法
def f1(a):i, len_str
&#61; 0,0c, c2, c3 &#61; 0,0,0len_str &#61; len(a)i &#61; 0b &#61; ""while i < len_str:c &#61; ord(a[i]) & 0xffi &#43;&#61; 1if i &#61;&#61; len_str:b &#43;&#61; encoderchars[c >> 2]b &#43;&#61; encoderchars[(c & 0x3) <<4]b &#43;&#61; "&#61;&#61;"breakc2 &#61; ord(a[i])i &#43;&#61; 1if i &#61;&#61; len_str:b &#43;&#61; encoderchars[c >> 2]b &#43;&#61; encoderchars[(((c & 0x3) <<4) | ((c2 & 0xf0) >> 4))]b &#43;&#61; encoderchars[((c2 & 0xf) <<2)]b &#43;&#61; "&#61;"breakc3 &#61; ord(a[i])b &#43;&#61; encoderchars[c >> 2]b &#43;&#61; encoderchars[(((c & 0x3) <<4) | ((c2 & 0xf0) >> 4))]b &#43;&#61; encoderchars[(((c2 & 0xf) <<2) | ((c3 & 0xc0) >> 6))]b &#43;&#61; encoderchars[c3 & 0x3f]i &#43;&#61; 1return bs &#61; requests.session()
result
&#61; s.get(&#39;http://datamining.comratings.com/exam&#39;)
session_id
&#61; result.COOKIEs.get_dict()[&#39;session&#39;]
#调用算法生成session
r_COOKIEs
&#61; &#39;session&#61;{};c1&#61;{}; c2&#61;{}; path&#61;/&#39;.format(session_id,f1(session_id[1:4]),f1(session_id))headers &#61; {"User-Agent":UserAgent().random,"COOKIE":r_COOKIEs
}ss
&#61; s.get(&#39;http://datamining.comratings.com/exam3&#39;,headers&#61;headers).textpattern &#61; re.compile(r&#39;(.*?)&#39;,re.DOTALL)
#用正则切出body内容
result
&#61; pattern.findall(ss)
result1
&#61; result[0].split(&#39;
&#39;) #根据
切出来的十一个片段sty &#61; re.compile(r&#39;&#39;,re.DOTALL)
sty1
&#61; sty.findall(ss) #style里面的内容
sty2
&#61; re.compile(r&#39;.(.*?){&#39;)
sty22
&#61; sty2.findall(sty1[0]) # style里面定义的四个属性组成的集合data &#61; [] #空数组&#xff0c;存放十个IP
data.append(result1[
0])for data_res in result1[1:]: #遍历按照换行切开的十段字符串line_array &#61; data_res.split(&#39;\n&#39;) #每一行组成的数组ip_data &#61; [] # 组成IP的四个数字存放的数组ip_str &#61; &#39;&#39;for line_str in line_array: #遍历每一行ip_regex &#61; re.compile(r&#39;\d&#43;&#39;)if sty22[0] not in line_str and sty22[1] not in line_str and &#39;none&#39; not in line_str:#利用正则切出符合条件的数字ip_array &#61; ip_regex.findall(line_str)if ip_array !&#61; []:ip_data.append(ip_array[0])#把筛选出来的的四个数字组合成IPip_str &#61; ip_data[0] &#43; &#39;.&#39; &#43; ip_data[1] &#43; &#39;.&#39; &#43; ip_data[2] &#43; &#39;.&#39; &#43; ip_data[3]#把每一个IP存到数组里data.append(ip_str)for i in data:print(i)

 

转:https://www.cnblogs.com/wdz1226/p/10434290.html



推荐阅读
  • 深入理解Cookie与Session会话管理
    本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息,以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制,解释其原理及应用场景。 ... [详细]
  • 使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表
    本文介绍了一段通用代码示例,该代码不仅能够操作 Azure Active Directory (AAD),还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级:AAD 和 Subscription。 ... [详细]
  • 本文深入探讨了HTTP请求和响应对象的使用,详细介绍了如何通过响应对象向客户端发送数据、处理中文乱码问题以及常见的HTTP状态码。此外,还涵盖了文件下载、请求重定向、请求转发等高级功能。 ... [详细]
  • 本文详细探讨了HTML表单中GET和POST请求的区别,包括它们的工作原理、数据传输方式、安全性及适用场景。同时,通过实例展示了如何在Servlet中处理这两种请求。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 导航栏样式练习:项目实例解析
    本文详细介绍了如何创建一个具有动态效果的导航栏,包括HTML、CSS和JavaScript代码的实现,并附有详细的说明和效果图。 ... [详细]
  • 深入理解Tornado模板系统
    本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块,支持嵌入Python代码片段,帮助开发者快速构建动态网页。 ... [详细]
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
  • 本文详细介绍了如何使用Python编写爬虫程序,从豆瓣电影Top250页面抓取电影信息。文章涵盖了从基础的网页请求到处理反爬虫机制,再到多页数据抓取的全过程,并提供了完整的代码示例。 ... [详细]
  • 本文探讨了在不使用服务器控件的情况下,如何通过多种方法获取并修改页面中的HTML元素值。除了常见的AJAX方式,还介绍了其他可行的技术方案。 ... [详细]
  • 5G至4G空闲态移动TAU流程解析
    本文详细解析了用户从5G网络移动到4G网络时,在空闲态下触发的跟踪区更新(TAU)流程。通过N26接口实现无缝迁移,确保用户体验不受影响。 ... [详细]
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • 深入解析 Apache Shiro 安全框架架构
    本文详细介绍了 Apache Shiro,一个强大且灵活的开源安全框架。Shiro 专注于简化身份验证、授权、会话管理和加密等复杂的安全操作,使开发者能够更轻松地保护应用程序。其核心目标是提供易于使用和理解的API,同时确保高度的安全性和灵活性。 ... [详细]
  • PHP 过滤器详解
    本文深入探讨了 PHP 中的过滤器机制,包括常见的 $_SERVER 变量、filter_has_var() 函数、filter_id() 函数、filter_input() 函数及其数组形式、filter_list() 函数以及 filter_var() 和其数组形式。同时,详细介绍了各种过滤器的用途和用法。 ... [详细]
author-avatar
oDavid_仔o_880
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有