pythonreferer伪造_Python标准库urllib2伪装http_referer和useragent访问

作者：呀yuan- | 来源：互联网 | 2023-09-13 12:39

前面博客介绍了python标准库urllib2的基本使用和linux系统curl命令伪装http_referer和user-agent访问，不懂的可以点击链接再看下。

前面博客介绍了python标准库urllib2的基本使用和linux系统curl命令伪装http_referer和user-agent访问&＃xff0c;不懂的可以点击链接再看下。这篇文章继续以伪装为目的&＃xff0c;不过完全使用urllib2来实现。步骤如下&＃xff0c;先创建request对象&＃xff0c;然后修改request对象以增加header信息&＃xff0c;最后把request对象传递给urllib2的urlopen方法。

代码如下&＃xff1a;

#coding:utf-8

import urllib2

def visitWebsite(url,timeout&＃61;60):

req&＃61;urllib2.Request(url)

req.add_header(&＃39;Referer&＃39;, &＃39;https://zhangnq.com/&＃39;)

req.add_header(&＃39;User-Agent&＃39;,"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36")

try:

response&＃61;urllib2.urlopen(req,timeout&＃61;timeout)

print "Url: %s\t%s" % (url,response.getcode())

except urllib2.URLError as e:

if hasattr(e, &＃39;code&＃39;):

print "Url: %s\t%s" % (url,e.code)

elif hasattr(e, &＃39;reason&＃39;):

print "Url: %s\t%s" % (url,&＃39;error&＃39;)

except:

pass

finally:

if response:

response.close()

if __name__ &＃61;&＃61; &＃39;__main__&＃39;:

urls&＃61;[

&＃39;http://www.baidu.com/&＃39;,

&＃39;http://www.qq.com/&＃39;,

]

for url in urls:

visitWebsite(url)

这个伪装一般做网站采集可能会用到。好了&＃xff0c;就是那么简单。

参考网址&＃xff1a;https://zhangnq.com/2249.html

推荐阅读

post
Webmin远程命令执行漏洞复现及防护方法

本文介绍了Webmin远程命令执行漏洞CVE-2019-15107的漏洞详情和复现方法，同时提供了防护方法。漏洞存在于Webmin的找回密码页面中，攻击者无需权限即可注入命令并执行任意系统命令。文章还提供了相关参考链接和搭建靶场的步骤。此外，还指出了参考链接中的数据包不准确的问题，并解释了漏洞触发的条件。最后，给出了防护方法以避免受到该漏洞的攻击。 ... [详细]

蜡笔小新 2023-12-13 16:14:53
import
Python瓦片图下载、合并、绘图、标记的代码示例

本文提供了Python瓦片图下载、合并、绘图、标记的代码示例，包括下载代码、多线程下载、图像处理等功能。通过参考geoserver，使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法，供读者参考使用。 ... [详细]

蜡笔小新 2023-12-13 12:14:55
import
使用正则表达式爬取36Kr网站首页新闻的操作步骤和代码示例

本文介绍了使用正则表达式来爬取36Kr网站首页所有新闻的操作步骤和代码示例。通过访问网站、查找关键词、编写代码等步骤，可以获取到网站首页的新闻数据。代码示例使用Python编写，并使用正则表达式来提取所需的数据。详细的操作步骤和代码示例可以参考本文内容。 ... [详细]

蜡笔小新 2023-12-12 19:16:21
scala
响应式页面的概述和实现方式

本文介绍了响应式页面的概念和实现方式，包括针对不同终端制作特定页面和制作一个页面适应不同终端的显示。分析了两种实现方式的优缺点，提出了选择方案的建议。同时，对于响应式页面的需求和背景进行了讨论，解释了为什么需要响应式页面。 ... [详细]

蜡笔小新 2023-12-11 12:37:10
get
NetCore WebAPI开发探索及部署方法详解

本文介绍了NetCore WebAPI开发的探索过程，包括新建项目、运行接口获取数据、跨平台部署等。同时还提供了客户端访问代码示例，包括Post函数、服务器post地址、api参数等。详细讲解了部署模式选择、框架依赖和独立部署的区别，以及在Windows和Linux平台上的部署方法。 ... [详细]

蜡笔小新 2023-12-09 18:38:28
get
Python爬虫_HTTP标准

文章目录简介HTTP请求过程HTTP状态码含义HTTP头部信息Cookie状态管理HTTP请求方式简介HTTP协议（超文本传输协议）是用于从WWW服务 ... [详细]

蜡笔小新 2023-10-15 14:59:43
get
Python-图片和视频文件爬虫

最近在学Python，看了不少资料、视频，对爬虫比较感兴趣，爬过了网页文字、图片、视频。文字就不说了直接从网页上去根据标签分离出来就好了。图片和视频则需要在获取到相应的链接之后取做下载。以下是图片和视 ... [详细]

蜡笔小新 2023-10-15 09:28:43
import
Scrapy 爬取图片

1.创建Scrapy项目scrapystartprojectCrawlMeiziTuscrapygenspiderMeiziTuSpiderhttps:movie.douban.c ... [详细]

蜡笔小新 2023-10-14 15:02:27
get
C#导入、导出功能

导出功能protectedvoidbtnExport(objectsender,EventArgse){用来打开下载窗口stringfileName中 ... [详细]

蜡笔小新 2023-12-12 14:34:29
import
延迟注入工具（python）的SQL脚本

本文介绍了一个延迟注入工具（python）的SQL脚本，包括使用urllib2、time、socket、threading、requests等模块实现延迟注入的方法。该工具可以通过构造特定的URL来进行注入测试，并通过延迟时间来判断注入是否成功。 ... [详细]

蜡笔小新 2023-12-12 10:36:42
go
移动端常用单位——rem的使用方法和注意事项

本文介绍了移动端常用的单位rem的使用方法和注意事项，包括px、%、em、vw、vh等其他常用单位的比较。同时还介绍了如何通过JS获取视口宽度并动态调整rem的值，以适应不同设备的屏幕大小。此外，还提到了rem目前在移动端的主流地位。 ... [详细]

蜡笔小新 2023-12-12 07:20:50
go
markdown [软件代理设置]

本文由编程笔记#小编为大家整理，主要介绍了markdown[软件代理设置]相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-17 18:19:28
go
linux resin日志,linux resin 基本站点配置

进入配置文件目录：[rootlinuxidcresin-4.0.]#cdusrlocalresinconf查看都有哪些配置文件：[rootlinuxid ... [详细]

蜡笔小新 2023-10-17 17:36:18
post
flask+ajax post 400错误

表单代码 ... [详细]

蜡笔小新 2023-10-16 19:49:55
get
curl php authorization,PHP CURL 执行Authorization请求

在使用豆瓣OAuth登录接口时，我们需要发送这样的HTTPREQUEST请求:GETv2user~meHTTP1.1Host:https:api.douban.com ... [详细]

蜡笔小新 2023-10-15 13:35:22

呀yuan-

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章