作者:君与龙_501 | 来源:互联网 | 2023-05-23 05:56
这篇文章将为大家详细讲解有关python3爬虫如何构建请求header,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
写一个爬虫首先就是学会设置请求头header,这样才可以伪装成浏览器。下面小编我就来给大家简单分析一下python3怎样构建一个爬虫的请求头header。
1、python3跟2有了细微差别,所以我们先要引入request,python2没有这个request哦。然后复制网址给url,然后用一个字典来保存header,这个header怎么来的?看第2步。
![python3爬虫如何构建请求header](https://img1.php1.cn/3cd4a/24ed6/b64/edc436beaef849ac.png)
2、打开任意浏览器某一页面(要联网),按f12,然后点network,之后再按f5,然后就会看到“name”这里,我们点击name里面的任意文件即可。
![python3爬虫如何构建请求header](https://img1.php1.cn/3cd4a/24ed6/b64/151fd4ecc37a3b5a.png)
3、之后右边有一个headers,点击headers找到request headers,这个就是浏览器的请求报头了。
![python3爬虫如何构建请求header](https://img1.php1.cn/3cd4a/24ed6/b64/28c2fd4a42e9a8cf.png)
4、然后复制其中的user-agent,其他的COOKIE还有Accept可以要也可以不要,主要是伪装成浏览器,所以我就用了user-agent
![python3爬虫如何构建请求header](https://img1.php1.cn/3cd4a/24ed6/b64/b050bbc7fdcf1fb1.png)
5、接着再用Request方法把url和headers组合在一起就可以构造一个比较简单的请求了。Request有三个参数(url,data,headers),如果有使用data就是post请求了,没有就是get请求。这里我没有data,所以我就指定headers=header,不然header就会被当成data了。
![python3爬虫如何构建请求header](https://img1.php1.cn/3cd4a/24ed6/b64/2e4cf4b419affbc6.png)
6、请求对象rq就构造好了,然后用urlopen发送这个请求对象就可以了。这就是简单的请求头设置了。
![python3爬虫如何构建请求header](https://img1.php1.cn/3cd4a/24ed6/b64/2bd08a6bbd6285f8.png)
关于“python3爬虫如何构建请求header”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。