PyPortScanner
python多线程端口扫描器。
输出示例:
Github
背景
有时候,在进行网络相关的研究的时候,我们需要执行一些有目的的参数测量。而端口扫描就是其中比较普遍也比较重要的一项。所谓的端口扫描,就是指通过TCP握手或者别的方式来判别一个给定主机上的某些端口是否处理开放,或者说监听的状态。现有的使用比较广泛的端口扫描工具是nmap。毋庸置疑,nmap是一款非常强大且易于使用的软件。但nmap是一款运行于terminal中的软件,有时在别的代码中调用并不是很方便,甚至没有相应的库。另外,nmap依赖的其他库较多,在较老的系统中可能无法使用较新的nmap,这样会造成扫描的不便。另外,nmap在扫描时需要root权限。基于这个原因,我用python2.7自带的库开发了一款高效的多线程端口扫描器来满足使用需要。
具体实现
I. 利用TCP握手连接扫描一个给定的(ip,port)地址对
为了实现端口扫描,我们首先明白如何使用python socket与给定的(ip, port)进行TCP握手。为了完成TCP握手,我们需要先初始化一个TCP socket。在python中新建一个TCP socket的代码如下:
TCP_sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) #(1)
TCP_sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEPORT) #(2)
TCP_sock.settimeout(delay) #(3)
其中(1)是初始化socket的代码,socket.AF_INTE参数表示IPv4 socket,socket.SOCK_STREAM参数表示TCP socket。这样我们就初始化了一个使用IPv4,TCP协议的socket。 (2)使用了socket.setsockopt()来设置socket的另一些参数。socket.SOL_SOCKET指定当前socket将使用setsockopt()中后面的参数。socket.SO_REUSEPORT表明当前socket使用了可复用端口的设置。socket.SO_REUSEPORT具体含义可以参考另一篇文章。 (3)将socket的连接超时时间设置为delay变量所对应的时间(以秒为单位)。这么做是为了防止我们在一个连接上等待太久。 了解了如何新建一个socket,我们就可以开始对给定的(ip,port)对进行TCP连接。代码如下:
try:
result = TCP_sock.connect_ex((ip, int(port_number)))
# If the TCP handshake is successful, the port is OPEN. Otherwise it is CLOSE
if result == 0:
output[port_number] = 'OPEN'
else:
output[port_number] = 'CLOSE'
TCP_sock.close()
except socket.error as e:
output[port_number] = 'CLOSE'
pass
因为这是一个I/O操作,为了处理可能出现的异常,我们需要在try,except块处理这部分操作。其次,我们根据socket.connect_ex()方法连接目标地址,通过该方法返回的状态代码来判断连接是否成功。该方法返回0代表连接成功。所以当返回值为0的时候将当前端口记录为打开状态。反之记录为关闭。另外,当连接操作出现异常的时候,我们也将端口记录为关闭状态,因为其并不能被成功连接(可能因为防火墙或者数据包被过滤等原因)。 需要注意的是,在连接完成后我们一定要调用socket.close()方法来关闭与远程端口之间的TCP连接。否则的话我们的扫描操作可能会引起所谓的TCP连接悬挂问题(Hanging TCP connection)。
总结起来,TCP握手扫描的整体代码如下:
"""
Perform status checking for a given port on a given ip address using TCP handshake
Keyword arguments:
ip -- the ip address that is being scanned
port_number -- the port that is going to be checked
delay -- the time in seconds that a TCP socket waits until timeout
output -- a dict() that stores result pairs in {port, status} style (status = 'OPEN' or 'CLOSE')
"""
def __TCP_connect(ip, port_number, delay, output):
# Initilize the TCP socket object
TCP_sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
TCP_sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEPORT, 1)
TCP_sock.settimeout(delay)
try:
result = TCP_sock.connect_ex((ip, int(port_number)))
# If the TCP handshake is successful, the port is OPEN. Otherwise it is CLOSE
if result == 0:
output[port_number] = 'OPEN'
else:
output[port_number] = 'CLOSE'
TCP_sock.close()
except socket.error as e:
output[port_number] = 'CLOSE'
pass
II. 多线程扫描端口
单线程扫描虽然逻辑简单,但无疑是及其低效的。因为在扫描过程中要进行大量的数据包的发送和接受,所以这是一个I/O密集型的操作。如果只是用单线程进行扫描的话,程序会在等待回复的过程中浪费大量的时间。因此多线程的操作是很有必要的。这里,一个很自然的思路就是为每一个端口单独开一个线程进行扫描。 在这里我们将需要扫描的端口列表定为从Nmap中得到的前1000个使用频率最高的端口: __port_list = [1,3,6,9,13,17,19,20,21,22,23,24,25,30,32,37,42,49,53,70,79,80,81,82,83,84,88,89,99,106,109,110,113,119,125,135,139,143,146,161,163,179,199,211,222,254,255,259,264,280,301,306,311,340,366,389,406,416,425,427,443,444,458,464,481,497,500,512,513,514,524,541,543,544,548,554,563,...] 完整的端口表见top 1K commonly used ports 对于一个给定的ip地址,扫描的过程是这样的: 1. 取出一个端口 2. 新建一条线程,利用__TCP_connect()函数对该(ip,port)进行连接操作。 3. 调用thread.start()和thread.join()方法,使扫描的子线程开始工作并且命令主线程等待子线程死亡后再结束。 4. 重复这个过程直到所有的端口都被扫描过。 根据以上思路,多线程扫描的代码如下:
"""
Open multiple threads to perform port scanning
Keyword arguments:
ip -- the ip address that is being scanned
delay -- the time in seconds that a TCP socket waits until timeout
output -- a dict() that stores result pairs in {port, status} style (status = 'OPEN' or 'CLOSE')
"""
def __scan_ports_helper(ip, delay, output):
'''
Multithreading port scanning
'''
port_index = 0
while port_index # Ensure that the number of cocurrently running threads does not exceed the thread limit
while threading.activeCount() <__thread_limit and port_index # Start threads
thread &#61; threading.Thread(target &#61; __TCP_connect, args &#61; (ip, __port_list[port_index], delay, output))
thread.start()
# lock the thread until all threads complete
thread.join()
port_index &#61; port_index &#43; 1
其中__thread_limit参数是用来限制线程数目的。output是一个字典&#xff0c;以(port: status)的形式保存了扫描的结果。 thread.join()保证了主线程只有在所有子线程都结束之后才会继续执行&#xff0c;从而确保了我们一定会扫描全部的端口。
III. 多线程扫描多个网站
在多线程扫描端口的同时&#xff0c;如果我们能够多线程扫描多个网站&#xff0c;那么扫描的效率还将进一步提高。为了达到这个目的&#xff0c;我们需要另一个线程去管理一个网站对应的对其端口进行扫描的所有子线程。 除此之外&#xff0c;在这种情况下&#xff0c;我们必须删去__scan_ports_helper()中的thread.join()。否则主线程就会被端口扫描子线程阻塞&#xff0c;我们也就无法多线程扫描多个网站了。 在不使用join()的情况下&#xff0c;我们如何确保一个网站的扫描线程只有在完成对其全部端口的扫描之后才会返回呢&#xff1f;这里我使用的方法是检测output字典的长度。因为在全部扫描完成后&#xff0c;output的长度一定与__port_list的长度一致。 改变后的代码如下&#xff1a;
def __scan_ports_helper(ip, delay, output):
&#39;&#39;&#39;
Multithreading port scanning
&#39;&#39;&#39;
port_index &#61; 0
while port_index # Ensure that the number of cocurrently running threads does not exceed the thread limit
while threading.activeCount() <__thread_limit and port_index # Start threads
thread &#61; threading.Thread(target &#61; __TCP_connect, args &#61; (ip, __port_list[port_index], delay, output))
thread.start()
port_index &#61; port_index &#43; 1
while (len(output) continue
根据以上扫描线程的代码&#xff0c;端口扫描的管理线程的代码如下所示&#xff1a;
"""
Controller of the __scan_ports_helper() function
Keyword arguments:
ip -- the ip address that is being scanned
delay -- the time in seconds that a TCP socket waits until timeout
"""
def __scan_ports(websites, output_ip, delay):
scan_result &#61; {}
for website in websites:
website &#61; str(website)
scan_result[website] &#61; {}
thread &#61; threading.Thread(target &#61; __scan_ports_helper, args &#61; (ip, delay, scan_result[website]))
thread.start()
# lock the script until all threads complete
thread.join()
return scan_result
至此&#xff0c;我们就完成了一个多线程端口扫描器的全部代码。
IV. 总结&#xff01;利用这些代码扫描给定网站并输出结果
处于输出方便的考虑&#xff0c;我并没有使用多线程扫描多个网站&#xff0c;同时对每个网站多线程扫描多个端口的方法。在这个例子中只进行了多线程扫描端口&#xff0c;但同时只扫描一个网站的操作。
具体代码就不贴在这里了。大家可以去我的github查看。