python - 采集微信公众号文章遇到的问题!?

 凯锐斯_372 发布于 2022-10-27 09:23

代码很简单:

import requests
url = "http://weixin.sogou.com/weixin?type=1&query=luoji"
for i in range(1,200):

    headers = {"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36",
               "Referer":"http://weixin.sogou.com/weixin?type=1&query=luojisw"
               }
    response = requests.get(url,headers=headers)
    print ("罗技" in response.content.decode())

因为一开始访问的比较猛,所以访问了大约12个页面以后,就被禁止掉了.
但是很奇怪,本地的浏览器都可以正常访问!?~~??一般封ip不是连我这个都禁止了~??

现在不管怎么修改,(完全模拟他的浏览器头),采集的话,也会出现空页面....如何才能顺利的采集下去?

1 个回答
  • 用 requests.Session ,它会自动管理cookie

    >>> import requests as r
    >>> ssn = r.Session()
    >>> ssn.headers = headers # 尽量补齐必须的头信息
    >>> rsp = ssn.get(url)
    2022-10-27 09:23 回答
撰写答案
今天,你开发时遇到什么问题呢?
立即提问
热门标签
PHP1.CN | 中国最专业的PHP中文社区 | PNG素材下载 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有