热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

〖Python〗socket+select实现构建异步非阻塞模块

【socketselect实现构建异步非阻塞模块】对于异步IO请求的本质则是【非阻塞Socket】【IO多路复用】,那我们是否可以自定义异步IO模块,作

【socket + select 实现构建异步非阻塞模块】

对于异步IO请求的本质则是【非阻塞Socket】+【IO多路复用】,那我们是否可以自定义异步IO模块,作为客户端,用于发送请求呢?答案那是肯定的!

补充说明:select可操作任何对象,但对象内必须是有fileno方法,可以看作是一个数值,给系统提供(文件句柄),其内部执行的是socket对象fileno方法的返回值!

自定义一个插件,模块如下:

import socket
import selectclass Request(object):"""select监听的是有变化的对象,当多个socket通信存在的话,当发生变化时,无法确定哪个是哪个。此时就需要唯一指定哪个通信处理的是什么数据!我们想到的办法是,再另创建一个类,用于接收当前的socket和信息,实例化唯一的对象!巧妙之处就在于唯一化的处理,生成的每个对象都是唯一的!!!"""def __init__(self,sock,info):#初始化self.sock = sock 通信self.info = info 信息def fileno(self): #转换成fileno对象return self.sock.fileno()class NoBlockIO(object):def __init__(self):self.sock_list = []self.conns = []def add_request(self,req_info):"""创建请求假设:req_info = {'host': 'www.baidu.com', 'port': 80, 'path': '/'},:return:"""sock = socket.socket() #创建socket对象sock.setblocking(False) #设置为非阻塞#建立连接,因为是非阻塞状态,连接可能会出异常所以需要做异常处理。#此处一定要注意,不管报不报错,连接的请求肯定会发出!try:sock.connect((req_info['host'],req_info['port']))except BlockingIOError as e:pass#实例化唯一的通信对象obj = Request(sock,req_info) #将生成的sock对象和信息列表传递到Request类,然后获取对应的文件句柄,信息保留到self.sock_list.append(obj) #将得到的对象添加到sock_list 通信列表中self.conns.append(obj) #将得到的对象添加到conns 连接列表中def run(self):"""开始事件循环,检测:连接成功?数据是否返回?注意此处操作的就全是Request类生成的对象!!!:return:"""while True:# select.select([request对象,])r,w,e = select.select(self.sock_list,self.conns,[],0.05)# w,是否连接成功for obj in w:# 检查obj:request对象是谁,此时就需要唯一判断了!利用类可以封装对象的特性解决!# socket, {'host': 'www.baidu.com', 'port': 80, 'path': '/'},data = "GET %s http/1.1\r\nhost:%s\r\n\r\n" %(obj.info['path'],obj.info['host']) #发送GET请求的信息obj.sock.send(data.encode('utf-8')) #连接成功,发送字节数据self.conns.remove(obj) #然后在连接列表中删除这个对象,防止发送两次,排除循环通信的可能# 数据返回,接收到数据for obj in r:response = obj.sock.recv(8096) #成功接收到数据,接收返回的信息#单个回调函数obj.info['callback'](response) #指定对应对象执行回调函数,参数为返回的信息#多个回调函数的情况!#for func in obj.info['callback'] #指定对应对象执行回调函数,参数为返回的信息# func(response)
self.sock_list.remove(obj) #在监听列表中移除这个对象# 所有请求已经返回if not self.sock_list: #所有请求都处理完,就退出循环break

NBIO

调用这个插件,使用插件里的方法:

from .NBIO import NoBlockIO#自定义定义回调函数,对返回的信息进行处理(执行完毕之后,对数据进行什么操作)
def done1(response):print(response)def done2(response):print(response)#准备执行的信息,域名,端口号,回调函数
url_list = [{'host': 'www.baidu.com', 'port': 80, 'path': '/','callback': done1},{'host': 'www.cnblogs.com', 'port': 80, 'path': '/index.html','callback': done2},{'host': 'www.bing.com', 'port': 80, 'path': '/','callback': done2},
]
#实例化一个对象
noblockObj = NoBlockIO()#循环要处理的信息
for item in url_list:noblockObj.add_request(item) #为条信息创建请求

noblockObj.run()
#执行
#
谁先执行完就返回谁,相对独立,互不干扰!

执行脚本

异步是相对而言,需要时间循环去检测!
以上是简单的模块定制,更多的操作,例如:分割响应头,响应体;or 保存文件这些操作后续需要,再进行补充!

 

慎重说明:必须知道和理解整个执行的流程!!!

 

转:https://www.cnblogs.com/SHENGXIN/p/7684481.html



推荐阅读
  • 利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Exce ... [详细]
  • python模块之正则
    re模块可以读懂你写的正则表达式根据你写的表达式去执行任务用re去操作正则正则表达式使用一些规则来检测一些字符串是否符合个人要求,从一段字符串中找到符合要求的内容。在 ... [详细]
  • 本文介绍了如何使用Python爬取妙笔阁小说网仙侠系列中所有小说的信息,并将其保存为TXT和CSV格式。主要内容包括如何构造请求头以避免被网站封禁,以及如何利用XPath解析HTML并提取所需信息。 ... [详细]
  • 使用Tkinter构建51Ape无损音乐爬虫UI
    本文介绍了如何使用Python的内置模块Tkinter来构建一个简单的用户界面,用于爬取51Ape网站上的无损音乐百度云链接。虽然Tkinter入门相对简单,但在实际开发过程中由于文档不足可能会带来一些不便。 ... [详细]
  • Java 中的等时日期(int,int)方法,示例 ... [详细]
  • 本文详细探讨了使用Python3编写爬虫时如何应对网站的反爬虫机制,通过实例讲解了如何模拟浏览器访问,帮助读者更好地理解和应用相关技术。 ... [详细]
  • 自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析
    目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]
  • Spring Data JdbcTemplate 入门指南
    本文将介绍如何使用 Spring JdbcTemplate 进行数据库操作,包括查询和插入数据。我们将通过一个学生表的示例来演示具体步骤。 ... [详细]
  • HTTP(HyperTextTransferProtocol)是超文本传输协议的缩写,它用于传送www方式的数据。HTTP协议采用了请求响应模型。客服端向服务器发送一 ... [详细]
  • 本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节,作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识,为后续的机器学习应用打下坚实的基础。 ... [详细]
  • 事件是程序各部分之间的一种通信方式,也是异步编程的一种实现形式。本文将详细介绍EventTarget接口及其相关方法,以及如何使用监听函数处理事件。 ... [详细]
  • 小程序的授权和登陆
    小程序的授权和登陆 ... [详细]
  • 本文将深入探讨 iOS 中的 Grand Central Dispatch (GCD),并介绍如何利用 GCD 进行高效多线程编程。如果你对线程的基本概念还不熟悉,建议先阅读相关基础资料。 ... [详细]
  • 本文将带你快速了解 SpringMVC 框架的基本使用方法,通过实现一个简单的 Controller 并在浏览器中访问,展示 SpringMVC 的强大与简便。 ... [详细]
  • 用阿里云的免费 SSL 证书让网站从 HTTP 换成 HTTPS
    HTTP协议是不加密传输数据的,也就是用户跟你的网站之间传递数据有可能在途中被截获,破解传递的真实内容,所以使用不加密的HTTP的网站是不 ... [详细]
author-avatar
无心之无心
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有