当前位置: 开发笔记 > 运维 > 正文

linux上TCPconnectiontimeout问题解决办法

作者：咖喱2502894907 | 来源：互联网 | 2022-01-18 07:15

这篇文章主要介绍了linux上TCPconnectiontimeout问题解决办法的相关资料,需要的朋友可以参考下

linux上TCP connection timeout问题解决办法

最近在产线上经常出现connection timeout的问题，先看看Java 中关于connection timeout 的异常如何产生

JAVA中的timeout

java.net.SocketTimeoutException: connect timed out 
客户端异常:connect timed out 
  at java.net.PlainSocketImpl.socketConnect(Native Method) 
  at java.net.AbstractPlainSocketImpl.doConnect(AbstractPlainSocketImpl.java:345) 
  at java.net.AbstractPlainSocketImpl.connectToAddress(AbstractPlainSocketImpl.java:206) 
  at java.net.AbstractPlainSocketImpl.connect(AbstractPlainSocketImpl.java:188) 
  at java.net.SocksSocketImpl.connect(SocksSocketImpl.java:392) 
  at java.net.Socket.connect(Socket.java:589)

我们能经常看到的connect timed out异常产生，看一下java 是如何生成这个异常

plainsocketimpl.c 中

while (1) { 
        jlong newTime; 
#ifndef USE_SELECT 
        { 
          struct pollfd pfd; 
          pfd.fd = fd; 
          pfd.events = POLLOUT; 
 
          errno = 0; 
          connect_rv = NET_Poll(&pfd, 1, timeout); 
        } 
#else 
        { 
          fd_set wr, ex; 
          struct timeval t; 
 
          t.tv_sec = timeout / 1000; 
          t.tv_usec = (timeout % 1000) * 1000; 
 
          FD_ZERO(&wr); 
          FD_SET(fd, &wr); 
          FD_ZERO(&ex); 
          FD_SET(fd, &ex); 
 
          errno = 0; 
          connect_rv = NET_Select(fd+1, 0, &wr, &ex, &t); 
        } 
#endif 
 
        if (connect_rv >= 0) { 
          break; 
        } 
        if (errno != EINTR) { 
          break; 
        } 
 
        /* 
         * The poll was interrupted so adjust timeout and 
         * restart 
         */ 
        newTime = JVM_CurrentTimeMillis(env, 0); 
        timeout -= (newTime - prevTime); 
        if (timeout <= 0) { 
          connect_rv = 0; 
          break; 
        } 
        prevTime = newTime; 
 
      } /* while */ 
 
      if (connect_rv == 0) { 
        JNU_ThrowByName(env, JNU_JAVANETPKG "SocketTimeoutException", 
              "connect timed out"); 
 
        /* 
         * Timeout out but connection may still be established. 
         * At the high level it should be closed immediately but 
         * just in case we make the socket blocking again and 
         * shutdown input & output. 
         */ 
        SET_BLOCKING(fd); 
        JVM_SocketShutdown(fd, 2); 
        return; 
      }

这里可以看到在做connect的时候，是调用 NET_Poll 或者 NET_Select, 在linux 上就是使用 poll/select

当发生timeout的时候connect_rv=0 ，这里有个注意点虽然在poll/select 是传入timeout的时间，但是这是会被打断的，connect_rv返回的值为-1 ，所以jvm里面重新计算了timeout , 确保timeout 的时间片已经运行完了，才推出循环。

newTime = JVM_CurrentTimeMillis(env, 0); 
        timeout -= (newTime - prevTime); 
        if (timeout <= 0) { 
          connect_rv = 0; 
          break; 
        }

同时设置connect_rv 为0，也是下面只有当connect_rv为0的时候才抛出connect timeout

什么是connect timeout &＃63;

也就是client 发出 syn 包，server端在你指定的时间内没有回复ack，poll/select 返回0

server 端为什么没有回复ack, 因为syn包的回复是内核层的，要么网络层丢包，要么就是内核层back_log的queue满了，关于backlog在本片中就不详细描述了。

当时查看产线上的连接最高能到1000多，同时查看了backlog 的queue的大小

cat /proc/sys/net/ipv4/tcp_max_syn_backlog

有8192 在产线上没有这么多的客户端的连接，不可能backlog queue会满，虽然syn_backlog 的设置是8192 但并不代表服务器启动的时候设置成了8192，所以必须查这个端口所设置的backlog大小

ss -lt

看到Send-Q在8080端口是128 ，原来在服务器端启动listen 的时候设置了128的backlog

查看tomcat 的配置，默认bio的设置

产线上已经设置了acceptCount, 默认是100 但是这里设置了是5000 ，这与通过ss看到的send-q的结果严重不符合
通过内核代码分析,发现原来内核参数不仅仅是通过tcp_max_syn_backlog控制，同时也受somaxconn控制
查看

cat /proc/sys/net/core/somaxconn

发现值是128, OK 原因找到了，修改/etc/sysctl.conf 添加

net.core.somaxcOnn= 8192

sysctl -f /etc/sysctl.conf 重新加载一下，这样就能改变全局了

问题：是1000多个连接，500个工作线程，因为backlog的大小是受socket.accept控制的，我们通常境况下会单独起一个线程去serversocket.accept(),而当前server的load并不高，不因该会出现back_log queue出现满的情况,更何况只有1000多个连接，代码就是真相，查看tomcat的源码。

原来accptor 线程在accept 之前，会去countUpOrWaitConnection 发现接受到的的socket数目大于设置的work线程数目的时候，会停止accept.

countUpOrAwaitConnection(); 
 
         Socket socket = null; 
         try { 
           // Accept the next incoming connection from the server 
           // socket 
           socket = serverSocketFactory.acceptSocket(serverSocket); 
         } catch (IOException ioe) { 
           countDownConnection(); 
           // Introduce delay if necessary 
           errorDelay = handleExceptionWithDelay(errorDelay); 
           // re-throw 
           throw ioe; 
         }

也就是说当并发超过628个连接以上，就有可能出现backlog queue满的情况，而出现connect timeout的情况，一切皆清楚了。

感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

推荐阅读

linux
Spring框架中UserLogDao Bean未定义异常分析与解决

本文详细探讨了Spring框架中遇到的NoSuchBeanDefinitionException异常，具体涉及com.thinkplatform.dao.UserLogDao Bean未定义的问题，并提供了相应的解决方案。 ... [详细]

蜡笔小新 2024-11-17 17:16:33
ubuntu
PHP 图形函数中实现汉字显示的方法

本文详细介绍了如何在 PHP 的图形函数中正确显示汉字，包括具体的步骤和注意事项，适合初学者和有一定基础的开发者阅读。 ... [详细]

蜡笔小新 2024-11-24 10:58:45
ubuntu
PHP中Smarty模板引擎自定义函数详解

本文详细介绍了如何在PHP的Smarty模板引擎中自定义函数，并通过具体示例演示了这些函数的使用方法和应用场景。适合PHP后端开发者学习。 ... [详细]

蜡笔小新 2024-11-23 15:39:25
server
Servlet基础入门指南（上）

本文介绍了Tomcat的基本操作，包括启动、关闭及首次访问的方法，并详细讲解了如何在IDEA中创建Web项目，配置Servlet及其映射，以及如何将项目部署到Tomcat。 ... [详细]

蜡笔小新 2024-11-23 11:55:30
linux
WebBenchmark：强大的Web API性能测试工具

本文介绍了一款名为WebBenchmark的Web API性能测试工具，该工具不仅支持HTTP和HTTPS服务的测试，还提供了丰富的功能来帮助开发者进行高效的性能评估。 ... [详细]

蜡笔小新 2024-11-23 05:24:11
linux
CentOS 服务器自定义密码策略

随着Linux操作系统的广泛使用，确保用户账户及系统安全变得尤为重要。用户密码的复杂性直接关系到系统的整体安全性。本文将详细介绍如何在CentOS服务器上自定义密码规则，以增强系统的安全性。 ... [详细]

蜡笔小新 2024-11-22 19:15:42
ubuntu
H5技术实现经典游戏《贪吃蛇》

本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术，我们将探讨如何构建这款游戏的两种主要玩法：积分闯关和无尽模式。 ... [详细]

蜡笔小新 2024-11-21 20:16:59
服务器
我的读书清单（持续更新）

我的读书清单（持续更新）201705311.《一千零一夜》2006（四五年级）2.《中华上下五千年》2008（初一）3.《鲁滨孙漂流记》2008（初二）4.《钢铁是怎样炼成的》20 ... [详细]

蜡笔小新 2024-11-21 13:01:23
server
解决PHP项目在服务器无法抓取远程网页内容的问题

本文探讨了在使用PHP进行后端开发时，遇到的一个常见问题：即在本地环境中能够正常通过CURL获取远程网页内容，但在服务器上却无法实现。我们将分析可能的原因并提供解决方案。 ... [详细]

蜡笔小新 2024-11-21 10:31:32
ubuntu
从CodeIgniter中提取图像处理组件

本指南旨在帮助开发者在未使用CodeIgniter框架的情况下，如何独立使用其强大的图像处理功能，包括图像尺寸调整、创建缩略图、裁剪、旋转及添加水印等。 ... [详细]

蜡笔小新 2024-11-20 19:57:35
ubuntu
提升工作效率：掌握15个键盘快捷键

在日常工作中，熟练掌握计算机操作技巧能够显著提升工作效率。本文将介绍15个常用的键盘快捷键，帮助用户更加高效地完成工作任务。 ... [详细]

蜡笔小新 2024-11-19 15:20:10
server
解决Tomcat启动时出现org.apache.catalina.LifecycleException异常的方法

在尝试启动Java应用服务器Tomcat时，遇到了org.apache.catalina.LifecycleException异常。本文详细记录了异常的具体表现形式，并提供了有效的解决方案。 ... [详细]

蜡笔小新 2024-11-19 11:46:52
server
Ubuntu 环境下 MySQL、Tomcat 和 JDK 的安装与配置指南

本文详细介绍了在 Ubuntu 系统上安装和配置 MySQL、Tomcat 和 JDK 的步骤。通过本文，您将了解如何顺利安装这些组件，并确保它们能够正常协同工作。 ... [详细]

蜡笔小新 2024-11-18 10:21:36
server
MySQL Administrator: 监控与管理工具

本文介绍了 MySQL Administrator 的主要功能，包括图形化监控 MySQL 服务器的实时状态、连接健康度、内存健康度以及如何创建自定义的健康图表。此外，还详细解释了状态变量和系统变量的管理。 ... [详细]

蜡笔小新 2024-11-18 08:20:16
server
Centos7 Tomcat9 安装笔记

centos7,tom ... [详细]

蜡笔小新 2024-11-17 18:15:16

咖喱2502894907

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章