热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python爬虫初识web端微信登录(三)

目录







目录

一,轮询和长轮询

二,分析web端微信

三,爬虫套路



 


一,轮询和长轮询



短轮询


的基本思路就是浏览器每隔一段时间向浏览器发送http请求,服务器端在收到请求后,不论是否有数据更新,都直接进行响应。这种方式实现的即时通信,本质上还是浏览器发送请求,服务器接受请求的一个过程,通过让客户端不断的进行请求,使得客户端能够模拟实时地收到服务器端的数据的变化。

  这种方式的


优点


是比较简单,易于理解,实现起来也没有什么技术难点。


缺点


是显而易见的,这种方式由于需要不断的建立http连接,严重浪费了服务器端和客户端的资源。尤其是在客户端,距离来说,如果有数量级想对比较大的人同时位于基于短轮询的应用中,那么每一个用户的客户端都会疯狂的向服务器端发送http请求,而且不会间断。人数越多,服务器端压力越大,这是很不合理的。

因此短轮询不适用于那些同时在线用户数量比较大,并且很注重性能的Web应用。


var xhr = new XMLHttpRequest();
setInterval(function(){
xhr.open('GET','/user');
xhr.Onreadystatechange= function(){
};
xhr.send();
},1000)




长轮询


ajax实现当服务器收到客户端发来的请求后,服务器端不会直接进行响应,而是先将这个请求挂起,然后判断服务器端数据是否有更新。如果有更新,则进行响应,如果一直没有数据,则到达一定的时间限制(服务器端设置)才返回。 。 客户端Javascript响应处理函数会在处理完服务器返回的信息后,再次发出请求,重新建立连接。

  长轮询和短轮询比起来,明显减少了很多不必要的http请求次数,相比之下节约了资源。长轮询的缺点在于,连接挂起也会导致资源的浪费。


function ajax(){
var xhr = new XMLHttpRequest();
xhr.open('GET','/user');
xhr.Onreadystatechange= function(){
ajax();
};
xhr.send();
}



轮询与长轮询都是基于HTTP的,两者本身存在着缺陷:轮询需要更快的处理速度;长轮询则更要求处理并发的能力;两者都是“被动型服务器”的体现:服务器不会主动推送信息,而是在客户端发送ajax请求后进行返回的响应。而理想的模型是"在服务器端数据有了变化后,可以主动推送给客户端",这种"主动型"服务器是解决这类问题的很好的方案。Web Sockets就是这样的方案。


二,分析web端微信

请求路径 : https://wx.qq.com/ 

代码地址:https://github.com/duanlei123/wechat.git 有详细注释....


三,爬虫套路

1,GET

2,POST

3,COOKIEs

4,Headers

依次注意-考虑以上4点,便可成功爬取任何你想的....








推荐阅读
author-avatar
手机用户2502879747
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有