当前位置: 开发笔记 > 编程语言 > 正文

西刺代理python_python爬西刺代理

作者：lee | 来源：互联网 | 2023-09-03 11:24

爬IP代码importrequestsimportreimportdaukfrombs4importBeautifulSoupimporttimedefdaili():print(

爬IP代码

import requests

import re

import dauk

from bs4 import BeautifulSoup

import time

def daili():

print(&＃39;[+]极速爬取代理IP，默认为99页&＃39;)

for b in range(1,99):

url="http://www.xicidaili.com/nt/{}".format(b)

header={&＃39;User-Agent&＃39;: &＃39;Mozilla/5.0 (Windows NT 6.1; WOW64; rv:58.0) Gecko/20100101 Firefox/48.0&＃39;}

r=requests.get(url,headers=header)

gsx=BeautifulSoup(r.content,&＃39;html.parser&＃39;)

for line in gsx.find_all(&＃39;td&＃39;):

sf=line.get_text()

dailix=re.findall(&＃39;(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)&＃39;,str(sf))

for g in dailix:

po=".".join(g)

print(po)

with open (&＃39;采集到的IP.txt&＃39;,&＃39;a&＃39;) as l:

l.write(po+&＃39;\n&＃39;)

daili()

def dailigaoni():

print(&＃39;[+]极速爬取代理IP，默认为99页&＃39;)

for i in range(1,99):

url="http://www.xicidaili.com/nn/{}".format(i)

header={&＃39;User-Agent&＃39;:&＃39;Mozilla/5.0 (Windows NT 6.1 Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36&＃39;}

r=requests.get(url,headers=header)

bks=r.content

luk=re.findall(&＃39;(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)&＃39;,str(bks))

for g in luk:

vks=".".join(g)

print(vks)

with open(&＃39;采集到的IP.txt&＃39;,&＃39;a&＃39;) as b:

b.write(vks+&＃39;\n&＃39;)

dailigaoni()

def dailihtp():

print(&＃39;[+]极速爬取代理IP，默认为99页&＃39;)

for x in range(1,99):

header="{&＃39;User-Agent&＃39;:&＃39;Mozilla/5.0 (Windows NT 6.1 Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36&＃39;}"

url="http://www.xicidaili.com/wn/{}".format(x)

r=requests.get(url,headers=header)

gs=r.content

bs=re.findall(&＃39;(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)&＃39;,gs)

for kl in bs:

kgf=".".join(kl)

print(kgf)

with open (&＃39;采集到的IP.txt&＃39;,&＃39;a&＃39;) as h:

h.write(kgf)

dailihtp()

def dailihttps():

print(&＃39;[+]极速爬代理IP,默认为99页&＃39;)

for s in range(1,99):

url="http://www.xicidaili.com/wt/{}".format(s)

header={&＃39;User-Agent&＃39;:&＃39;Mozilla/5.0 (Windows NT 6.1 Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36&＃39;}

r=requests.get(url,headers=header)

kl=r.content

lox=re.findall(&＃39;(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)&＃39;,kl)

for lk in lox:

los=".".join(lk)

print(los)

with open(&＃39;采集到的IP.txt&＃39;,&＃39;a&＃39;) as lp:

lp.write(los)

dailihttps()

端口代码

import requests

import re

from bs4 import BeautifulSoup

def daili():

print(&＃39;[+]极速爬取代理IP端口，默认为99页&＃39;)

for b in range(1, 99):

url = "http://www.xicidaili.com/nt/{}".format(b)

header = {&＃39;User-Agent&＃39;: &＃39;Mozilla/5.0 (Windows NT 6.1; WOW64; rv:58.0) Gecko/20100101 Firefox/48.0&＃39;}

r = requests.get(url, headers=header)

gsx = BeautifulSoup(r.content, &＃39;html.parser&＃39;)

for line in gsx.find_all(&＃39;td&＃39;):

sf = line.get_text()

dailix = re.findall(

&＃39;

([0-9]|[1-9]\d{1,3}|[1-5]\d{4}|6[0-5]{2}[0-3][0-5])&＃39;,

str(sf))

for g in dailix:

po = ".".join(g)

print(po )

with open(&＃39;采集到的端口.txt.txt&＃39;, &＃39;a&＃39;) as l:

l.write(po + &＃39;\n&＃39;)

daili()

def dailigaoni():

print(&＃39;[+]极速爬取代理IP的端口，默认为99页&＃39;)

for i in range(1, 99):

url = "http://www.xicidaili.com/nn/{}".format(i)

header = {

&＃39;User-Agent&＃39;: &＃39;Mozilla/5.0 (Windows NT 6.1 Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36&＃39;}

r = requests.get(url, headers=header)

bks = r.content

luk = re.findall(

&＃39;

([0-9]|[1-9]\d{1,3}|[1-5]\d{4}|6[0-5]{2}[0-3][0-5])&＃39;,

str(bks))

for g in luk:

vks = ".".join(g)

print(vks)

with open(&＃39;采集到的端口.txt.txt&＃39;, &＃39;a&＃39;) as b:

b.write(vks + &＃39;\n&＃39;)

dailigaoni()

def dailihtp():

print(&＃39;[+]极速爬取代理IP，默认为99页&＃39;)

for x in range(1, 99):

header = "{&＃39;User-Agent&＃39;:&＃39;Mozilla/5.0 (Windows NT 6.1 Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36&＃39;}"

url = "http://www.xicidaili.com/wn/{}".format(x)

r = requests.get(url, headers=header)

gs = r.content

bs = re.findall(

&＃39;

([0-9]|[1-9]\d{1,3}|[1-5]\d{4}|6[0-5]{2}[0-3][0-5])&＃39;,

gs)

for kl in bs:

kgf = ".".join(kl)

print(kgf)

with open(&＃39;采集到的端口.txt.txt&＃39;, &＃39;a&＃39;) as h:

h.write(kgf)

dailihtp()

def dailihttps():

print(&＃39;[+]极速爬代理IP的端口,默认为99页&＃39;)

for s in range(1, 99):

url = "http://www.xicidaili.com/wt/{}".format(s)

header = {

&＃39;User-Agent&＃39;: &＃39;Mozilla/5.0 (Windows NT 6.1 Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36&＃39;}

r = requests.get(url, headers=header)

kl = r.content

lox = re.findall(

&＃39;

([0-9]|[1-9]\d{1,3}|[1-5]\d{4}|6[0-5]{2}[0-3][0-5])&＃39;,

kl)

for lk in lox:

los = ".".join(lk)

print(los)

with open(&＃39;采集到的端口.txt&＃39;, &＃39;a&＃39;) as lp:

lp.write(los)

dailihttps()

调用代码

print(&＃39;&＃39;&＃39;

_ooOoo_

o8888888o

88" . "88

(| -_- |)

O\ = /O

____/`---&＃39;\____

.&＃39; \\| |// `.

/ \\||| : |||// \

/ _||||| -:- |||||- \

| | \\\ - /// | |

| \_| &＃39;&＃39;\---/&＃39;&＃39; | |

\ .-\__ `-` ___/-. /

___`. .&＃39; /--.--\ `. . __

."" &＃39;<`.___\__/___.&＃39; >&＃39;"".

| | : `- \`.;`\ _ /`;.`/ - ` : | |

\ \ `-. \_ __\ /__ _/ .-` / /

======`-.____`-.___\_____/___.-`____.-&＃39;======

`=---=&＃39;

^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

佛祖保佑永无BUG

&＃39;&＃39;&＃39;)

print(&＃39;[!]爬虫速度过快，导致IP被封请更换IP&＃39;)

print(&＃39;[*]极速爬取代理IP&＃39;)

print(&＃39;1.普通代理IP&＃39;)

print(&＃39;2.高匿代理IP&＃39;)

print(&＃39;3.http代理IP&＃39;)

print(&＃39;4.https代理IP&＃39;)

bk=input(&＃39;请选择：&＃39;)

def xs():

import 代理.daili

import 代理.dauk

if bk==&＃39;1&＃39;:

代理.daili.daili.daili()

代理.dauk.daili()

exit()

elif bk==&＃39;2&＃39;:

代理.daili.daili.dailigaoni()

代理.dauk.dailigaoni()

exit()

elif bk==&＃39;3&＃39;:

代理.daili.daili.dailihtp()

代理.dauk.dailihtp()

exit()

elif bk==&＃39;4&＃39;:

代理.daili .daili.dailihttps()

代理.dauk.dailihttps()

exit()

elif bk==&＃39;q&＃39;:

exit()

else:

print(&＃39;[-]没有找到你要的选项&＃39;)

xs()

2018-02-17

推荐阅读

sum
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
php
SoundPool

如果应用程序经常播放密集、急促而又短暂的音效（如游戏音效）那么使用MediaPlayer显得有些不太适合了。因为MediaPlayer存在如下缺点：1)延时时间较长，且资源占用率高 ... [详细]

蜡笔小新 2024-11-13 16:47:19
python
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
python
（7）Python爬虫——爬取豆瓣电影Top250

利用python爬取豆瓣电影Top250的相关信息，包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容，然后将爬取的信息写入Exce ... [详细]

蜡笔小新 2024-11-13 11:35:24
function
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
php
使用多项式拟合分析淘宝双11销售趋势

根据天猫官方数据，2019年双11成交额达到2684亿元，再次刷新历史记录。本文通过多项式拟合方法，分析并预测未来几年的销售趋势。 ... [详细]

蜡笔小新 2024-11-12 16:57:26
php
Pythonmysql数据库

importpymysql#一、直接连接mysql数据库'''coonpymysql.connect(host'192.168.*.*',u ... [详细]

蜡笔小新 2024-11-12 16:51:59
php
c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

[转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]

蜡笔小新 2024-11-12 16:19:40
function
使用 Matplotlib 保存 Python 动态图像为视频文件的方法与技巧

本文介绍了如何利用 `matplotlib` 库中的 `FuncAnimation` 类将 Python 中的动态图像保存为视频文件。通过详细解释 `FuncAnimation` 类的参数和方法，文章提供了多种实用技巧，帮助用户高效地生成高质量的动态图像视频。此外，还探讨了不同视频编码器的选择及其对输出文件质量的影响，为读者提供了全面的技术指导。 ... [详细]

蜡笔小新 2024-11-11 22:11:30
header
大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式

大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式 ... [详细]

蜡笔小新 2024-11-11 19:05:59
object
Spring 3.0.5 中获取 MySQL 表的自增主键

本文介绍了如何在 Spring 3.0.5 中使用 JdbcTemplate 插入数据并获取 MySQL 表中的自增主键。 ... [详细]

蜡笔小新 2024-11-13 18:00:32
function
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
php
PHP 对象生命周期与内存管理

本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用，包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]

蜡笔小新 2024-11-12 13:35:26
function
检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0

检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0 ... [详细]

蜡笔小新 2024-11-12 11:35:01
php
MySQL 数据迁移时 .frm 文件报错问题

本文讨论了在进行 MySQL 数据迁移过程中遇到的所有 .frm 文件报错的问题，并提供了详细的解决方案和建议。 ... [详细]

蜡笔小新 2024-11-12 10:47:49

lee

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章