python批量扫描ip端口_如何用python编写一个高效的多线程端口扫描器

作者：张嫱的小屋_133 | 来源：互联网 | 2023-08-27 16:25

PyPortScannerpython多线程端口扫描器。输出示例：Github背景有时候，在进行网络相关的研究的时候，我们需要执行一些有目

PyPortScanner

python多线程端口扫描器。

输出示例&＃xff1a;

Github

背景

有时候&＃xff0c;在进行网络相关的研究的时候&＃xff0c;我们需要执行一些有目的的参数测量。而端口扫描就是其中比较普遍也比较重要的一项。所谓的端口扫描&＃xff0c;就是指通过TCP握手或者别的方式来判别一个给定主机上的某些端口是否处理开放&＃xff0c;或者说监听的状态。现有的使用比较广泛的端口扫描工具是nmap。毋庸置疑&＃xff0c;nmap是一款非常强大且易于使用的软件。但nmap是一款运行于terminal中的软件&＃xff0c;有时在别的代码中调用并不是很方便&＃xff0c;甚至没有相应的库。另外&＃xff0c;nmap依赖的其他库较多&＃xff0c;在较老的系统中可能无法使用较新的nmap&＃xff0c;这样会造成扫描的不便。另外&＃xff0c;nmap在扫描时需要root权限。基于这个原因&＃xff0c;我用python2.7自带的库开发了一款高效的多线程端口扫描器来满足使用需要。

具体实现

I. 利用TCP握手连接扫描一个给定的(ip,port)地址对

为了实现端口扫描&＃xff0c;我们首先明白如何使用python socket与给定的(ip, port)进行TCP握手。为了完成TCP握手&＃xff0c;我们需要先初始化一个TCP socket。在python中新建一个TCP socket的代码如下&＃xff1a;

TCP_sock &＃61; socket.socket(socket.AF_INET, socket.SOCK_STREAM) #(1)

TCP_sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEPORT) #(2)

TCP_sock.settimeout(delay) #(3)

其中(1)是初始化socket的代码&＃xff0c;socket.AF_INTE参数表示IPv4 socket&＃xff0c;socket.SOCK_STREAM参数表示TCP socket。这样我们就初始化了一个使用IPv4&＃xff0c;TCP协议的socket。 (2)使用了socket.setsockopt()来设置socket的另一些参数。socket.SOL_SOCKET指定当前socket将使用setsockopt()中后面的参数。socket.SO_REUSEPORT表明当前socket使用了可复用端口的设置。socket.SO_REUSEPORT具体含义可以参考另一篇文章。 (3)将socket的连接超时时间设置为delay变量所对应的时间(以秒为单位)。这么做是为了防止我们在一个连接上等待太久。了解了如何新建一个socket&＃xff0c;我们就可以开始对给定的(ip,port)对进行TCP连接。代码如下&＃xff1a;

try:

result &＃61; TCP_sock.connect_ex((ip, int(port_number)))

# If the TCP handshake is successful, the port is OPEN. Otherwise it is CLOSE

if result &＃61;&＃61; 0:

output[port_number] &＃61; &＃39;OPEN&＃39;

else:

output[port_number] &＃61; &＃39;CLOSE&＃39;

TCP_sock.close()

except socket.error as e:

output[port_number] &＃61; &＃39;CLOSE&＃39;

pass

因为这是一个I/O操作&＃xff0c;为了处理可能出现的异常&＃xff0c;我们需要在try,except块处理这部分操作。其次&＃xff0c;我们根据socket.connect_ex()方法连接目标地址&＃xff0c;通过该方法返回的状态代码来判断连接是否成功。该方法返回0代表连接成功。所以当返回值为0的时候将当前端口记录为打开状态。反之记录为关闭。另外&＃xff0c;当连接操作出现异常的时候&＃xff0c;我们也将端口记录为关闭状态&＃xff0c;因为其并不能被成功连接(可能因为防火墙或者数据包被过滤等原因)。需要注意的是&＃xff0c;在连接完成后我们一定要调用socket.close()方法来关闭与远程端口之间的TCP连接。否则的话我们的扫描操作可能会引起所谓的TCP连接悬挂问题(Hanging TCP connection)。

总结起来&＃xff0c;TCP握手扫描的整体代码如下&＃xff1a;

"""

Perform status checking for a given port on a given ip address using TCP handshake

Keyword arguments:

ip -- the ip address that is being scanned

port_number -- the port that is going to be checked

delay -- the time in seconds that a TCP socket waits until timeout

output -- a dict() that stores result pairs in {port, status} style (status &＃61; &＃39;OPEN&＃39; or &＃39;CLOSE&＃39;)

"""

def __TCP_connect(ip, port_number, delay, output):

# Initilize the TCP socket object

TCP_sock &＃61; socket.socket(socket.AF_INET, socket.SOCK_STREAM)

TCP_sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEPORT, 1)

TCP_sock.settimeout(delay)

try:

result &＃61; TCP_sock.connect_ex((ip, int(port_number)))

# If the TCP handshake is successful, the port is OPEN. Otherwise it is CLOSE

if result &＃61;&＃61; 0:

output[port_number] &＃61; &＃39;OPEN&＃39;

else:

output[port_number] &＃61; &＃39;CLOSE&＃39;

TCP_sock.close()

except socket.error as e:

output[port_number] &＃61; &＃39;CLOSE&＃39;

pass

II. 多线程扫描端口

单线程扫描虽然逻辑简单&＃xff0c;但无疑是及其低效的。因为在扫描过程中要进行大量的数据包的发送和接受&＃xff0c;所以这是一个I/O密集型的操作。如果只是用单线程进行扫描的话&＃xff0c;程序会在等待回复的过程中浪费大量的时间。因此多线程的操作是很有必要的。这里&＃xff0c;一个很自然的思路就是为每一个端口单独开一个线程进行扫描。在这里我们将需要扫描的端口列表定为从Nmap中得到的前1000个使用频率最高的端口&＃xff1a; __port_list &＃61; [1,3,6,9,13,17,19,20,21,22,23,24,25,30,32,37,42,49,53,70,79,80,81,82,83,84,88,89,99,106,109,110,113,119,125,135,139,143,146,161,163,179,199,211,222,254,255,259,264,280,301,306,311,340,366,389,406,416,425,427,443,444,458,464,481,497,500,512,513,514,524,541,543,544,548,554,563,...] 完整的端口表见top 1K commonly used ports 对于一个给定的ip地址&＃xff0c;扫描的过程是这样的&＃xff1a; 1. 取出一个端口 2. 新建一条线程&＃xff0c;利用__TCP_connect()函数对该(ip,port)进行连接操作。 3. 调用thread.start()和thread.join()方法&＃xff0c;使扫描的子线程开始工作并且命令主线程等待子线程死亡后再结束。 4. 重复这个过程直到所有的端口都被扫描过。根据以上思路&＃xff0c;多线程扫描的代码如下&＃xff1a;

"""

Open multiple threads to perform port scanning

Keyword arguments:

ip -- the ip address that is being scanned

delay -- the time in seconds that a TCP socket waits until timeout

output -- a dict() that stores result pairs in {port, status} style (status &＃61; &＃39;OPEN&＃39; or &＃39;CLOSE&＃39;)

"""

def __scan_ports_helper(ip, delay, output):

&＃39;&＃39;&＃39;

Multithreading port scanning

&＃39;&＃39;&＃39;

port_index &＃61; 0

while port_index

# Ensure that the number of cocurrently running threads does not exceed the thread limit

while threading.activeCount() <__thread_limit and port_index

# Start threads

thread &＃61; threading.Thread(target &＃61; __TCP_connect, args &＃61; (ip, __port_list[port_index], delay, output))

thread.start()

# lock the thread until all threads complete

thread.join()

port_index &＃61; port_index &＃43; 1

其中__thread_limit参数是用来限制线程数目的。output是一个字典&＃xff0c;以(port: status)的形式保存了扫描的结果。 thread.join()保证了主线程只有在所有子线程都结束之后才会继续执行&＃xff0c;从而确保了我们一定会扫描全部的端口。

III. 多线程扫描多个网站

在多线程扫描端口的同时&＃xff0c;如果我们能够多线程扫描多个网站&＃xff0c;那么扫描的效率还将进一步提高。为了达到这个目的&＃xff0c;我们需要另一个线程去管理一个网站对应的对其端口进行扫描的所有子线程。除此之外&＃xff0c;在这种情况下&＃xff0c;我们必须删去__scan_ports_helper()中的thread.join()。否则主线程就会被端口扫描子线程阻塞&＃xff0c;我们也就无法多线程扫描多个网站了。在不使用join()的情况下&＃xff0c;我们如何确保一个网站的扫描线程只有在完成对其全部端口的扫描之后才会返回呢&＃xff1f;这里我使用的方法是检测output字典的长度。因为在全部扫描完成后&＃xff0c;output的长度一定与__port_list的长度一致。改变后的代码如下&＃xff1a;

def __scan_ports_helper(ip, delay, output):

&＃39;&＃39;&＃39;

Multithreading port scanning

&＃39;&＃39;&＃39;

port_index &＃61; 0

while port_index

# Ensure that the number of cocurrently running threads does not exceed the thread limit

while threading.activeCount() <__thread_limit and port_index

# Start threads

thread &＃61; threading.Thread(target &＃61; __TCP_connect, args &＃61; (ip, __port_list[port_index], delay, output))

thread.start()

port_index &＃61; port_index &＃43; 1

while (len(output)

continue

根据以上扫描线程的代码&＃xff0c;端口扫描的管理线程的代码如下所示&＃xff1a;

"""

Controller of the __scan_ports_helper() function

Keyword arguments:

ip -- the ip address that is being scanned

delay -- the time in seconds that a TCP socket waits until timeout

"""

def __scan_ports(websites, output_ip, delay):

scan_result &＃61; {}

for website in websites:

website &＃61; str(website)

scan_result[website] &＃61; {}

thread &＃61; threading.Thread(target &＃61; __scan_ports_helper, args &＃61; (ip, delay, scan_result[website]))

thread.start()

# lock the script until all threads complete

thread.join()

return scan_result

至此&＃xff0c;我们就完成了一个多线程端口扫描器的全部代码。

IV. 总结&＃xff01;利用这些代码扫描给定网站并输出结果

处于输出方便的考虑&＃xff0c;我并没有使用多线程扫描多个网站&＃xff0c;同时对每个网站多线程扫描多个端口的方法。在这个例子中只进行了多线程扫描端口&＃xff0c;但同时只扫描一个网站的操作。

具体代码就不贴在这里了。大家可以去我的github查看。

推荐阅读

js
技术分享：使用 Flask、AngularJS 和 Jinja2 构建高效前后端交互系统

技术分享：使用 Flask、AngularJS 和 Jinja2 构建高效前后端交互系统 ... [详细]

蜡笔小新 2024-11-11 15:24:24
header
2023年最新指南：如何在PHP中屏蔽警告和错误

本文详细介绍了如何在PHP中屏蔽警告和错误，包括多种方法和最佳实践，帮助开发者提升代码质量和安全性。 ... [详细]

蜡笔小新 2024-11-16 02:00:40
js
centos 7.0 lnmp成功安装过程（很乱）

下载nginx[rootlocalhostsrc]#wgethttp:nginx.orgdownloadnginx-1.7.9.tar.gz--2015-01-2412:55:2 ... [详细]

蜡笔小新 2024-11-15 14:20:54
process
Python多进程高效读取超大文件的技巧

本文详细介绍了如何使用Python的多进程技术来高效地分块读取超大文件，并将其输出为多个文件。通过这种方式，可以显著提高读取速度和处理效率。 ... [详细]

蜡笔小新 2024-11-14 10:59:08
foreach
机器学习算法：SVM（支持向量机）

SVM算法（SupportVectorMachine，支持向量机）的核心思想有2点：1、如果数据线性可分，那么基于最大间隔的方式来确定超平面，以确保全局最优， ... [详细]

蜡笔小新 2024-11-14 04:33:58
char
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
md5
在List和Set集合中存储Object类型的数据元素

在List和Set集合中存储Object类型的数据元素 ... [详细]

蜡笔小新 2024-11-09 18:55:32
md5
Spring 中策略模式的应用：Resource 接口详解

本文探讨了在 Spring 框架中如何利用 Resource 接口实现资源访问策略。Resource 接口作为资源访问策略的抽象，通过多种实现类支持不同类型的资源访问。 ... [详细]

蜡笔小新 2024-11-15 23:58:40
header
java解析json转Map

java解析json转Map前段时间在做json报文处理的时候，写了一个针对不同格式json转map的处理工具方法，总结记录如下：1、单节点单层级、单节点多层级json转mapim ... [详细]

蜡笔小新 2024-11-15 18:21:27
go
Ubuntu 22.04 安装搜狗输入法详细指南及常见问题解决方案

本文将详细介绍如何在 Ubuntu 22.04 上安装搜狗输入法，并提供常见问题的解决方法。包括下载安装包、更新源、安装依赖项等步骤。 ... [详细]

蜡笔小新 2024-11-15 10:11:27
hash
C#实现文件的压缩与解压

2019独角兽企业重金招聘Python工程师标准一、准备工作1、下载ICSharpCode.SharpZipLib.dll文件2、项目中引用这个dll二、文件压缩与解压共用类 ... [详细]

蜡笔小新 2024-11-14 10:37:34
instance
Spring Data JdbcTemplate 入门指南

本文将介绍如何使用 Spring JdbcTemplate 进行数据库操作，包括查询和插入数据。我们将通过一个学生表的示例来演示具体步骤。 ... [详细]

蜡笔小新 2024-11-14 10:33:29
instance
禁止Mysql默认端口访问Internet

过去查询Mysql的时候，都见3306对所有端口开放着，感觉不安全。netstat -anlp | grep mysqltcp 0&am ... [详细]

蜡笔小新 2024-11-13 17:36:31
js
SoundPool

如果应用程序经常播放密集、急促而又短暂的音效（如游戏音效）那么使用MediaPlayer显得有些不太适合了。因为MediaPlayer存在如下缺点：1)延时时间较长，且资源占用率高 ... [详细]

蜡笔小新 2024-11-13 16:47:19
js
面试中如何回答“零拷贝”技术问题？

零拷贝技术是提高I/O性能的重要手段，常用于Java NIO、Netty、Kafka等框架中。本文将详细解析零拷贝技术的原理及其应用。 ... [详细]

蜡笔小新 2024-11-13 02:03:52

张嫱的小屋_133

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章