作者:許宸瑜_ | 来源:互联网 | 2023-09-03 14:56
篇首语:本文由编程笔记#小编为大家整理,主要介绍了selenium源码通读·10|webdriver/common/proxy.py-Proxy类分析相关的知识,希望对你有一定的参考价值。
篇首语:本文由编程笔记#小编为大家整理,主要介绍了selenium源码通读·10 |webdriver/common/proxy.py-Proxy类分析相关的知识,希望对你有一定的参考价值。
·10 |webdriver/common/proxy.py-Proxy类分析
- 1 源码路径
- 2 功能说明
- 3 引入原因
- 4 代理类型
- 5 代理类型模式或属性
- 6 各种代理实现
- 7 实例说明
1 源码路径
selenium/webdriver/common/proxy.py
2 功能说明
3 引入原因
selenium webdriver
测试或进行爬虫时,如果未在目标服务的白名单内,随着爬取的频率增多会被禁止访问目标服务;- 目标服务的反爬虫策略相对完善的情况下,容易将selenium的爬取给禁止;
- 采用分布式selenium爬取方式时,也会很容易的被禁止爬取;
综上,所以Proxy类提供了一些反爬虫策略,
4 代理类型
class ProxyType:
"""
Set of possible types of proxy.
Each proxy type has 2 properties:
'ff_value' is value of Firefox profile preference,
'string' is id of proxy type.
"""
DIRECT = ProxyTypeFactory.make(0, 'DIRECT')
MANUAL = ProxyTypeFactory.make(1, 'MANUAL')
PAC = ProxyTypeFactory.make(2, 'PAC')
RESERVED_1 = ProxyTypeFactory.make(3, 'RESERVED1')
AUTODETECT = ProxyTypeFactory.make(4, 'AUTODETECT')
SYSTEM = ProxyTypeFactory.make(5, 'SYSTEM')
UNSPECIFIED = ProxyTypeFactory.make(6, 'UNSPECIFIED')
代理类型 | 说明 |
---|
DIRECT | 直接连接,无代理(Windows上的默认设置 |
MANUAL | 手动代理设置(例如,对于httpProxy ) |
PAC | 来自URL的代理自动配置 |
RESERVED_1 | 从未使用过 |
AUTODETECT | 代理自动检测(可能是WPAD) |
SYSTEM | 使用系统设置(Linux上的默认设置) |
UNSPECIFIED | 未初始化(供内部使用) |
5 代理类型模式或属性
class ProxyTypeFactory:
"""
Factory for proxy types.
"""
@staticmethod
def make(ff_value, string):
return 'ff_value': ff_value, 'string': string
参数 | 说明 |
---|
ff_value | Firefox配置文件首选项的值 |
string | 代理类型的ID |
6 各种代理实现
class Proxy(object):
"""
Proxy contains information about proxy type and necessary proxy settings.
"""
proxyType = ProxyType.UNSPECIFIED
autodetect = False
ftpProxy = ''
httpProxy = ''
noProxy = ''
proxyAutoconfigUrl = ''
sslProxy = ''
socksProxy = ''
socksUsername = ''
socksPassword = ''
- 说明:每种代理,都是通过两个方法来实现,先返回代理设置,然后再对代理进行具体的值设置,如下:
@property
def http_proxy(self):
"""
Returns http proxy setting.
"""
return self.httpProxy
@http_proxy.setter
def http_proxy(self, value):
"""
Sets http proxy setting.
:Args:
- value: The http proxy value.
"""
self._verify_proxy_type_compatibility(ProxyType.MANUAL)
self.proxyType = ProxyType.MANUAL
self.httpProxy = value
7 实例说明
from selenium import webdriver
from selenium.webdriver.firefox.firefox_profile import FirefoxProfile
profile = FirefoxProfile()
profile.set_preference("network.proxy.type", 1)
profile.set_preference("network.proxy.http", "ip")
profile.set_preference("network.proxy.http_port", port)
profile.set_preference("network.proxy.share_proxy_settings", True)
driver= webdriver.Firefox(profile)
driver.get('xxxxx')
『全栈测试技术,分享,共勉,共进,提升』