ClickHouse那些年我们遇到过的问题

作者：hgsfaerqw_504 | 来源：互联网 | 2023-08-21 16:48

在使用ClickHouse当中，相信大家都遇到过各种各样的报错信

在使用ClickHouse当中，相信大家都遇到过各种各样的报错信息，难道从入门到放弃? 下面我将常见的报错总结，供大家参考排查问题。

1.1 问题再现

Memory limit (for query) exceeded:would use 9.37 GiB (attempt to allocate chunk of 301989888 bytes), maximum: 9.31 GiB

1.2 分析问题

默认情况下，ClickHouse会限制了SQL的查询内存使用的上线，当内存使用量大于该值的时候，查询被强制KILL。

1.3 解决问题

对于常规的如下简单的SQL, 查询的空间复杂度为O(1) 。

select count(1) from table where column1=xxx;

对于group by, order by , count distinct这样的复杂的SQL，查询的空间复杂度就不是O(1)了，需要使用大量的内存。

如果是group by内存不够，推荐配置上max_bytes_before_external_group_by参数，当使用内存到达该阈值，进行磁盘group by。推荐配置为max_memory_usage的一半。
如果是order by内存不够，推荐配置上max_bytes_before_external_sort参数，当使用内存到达该阈值，进行磁盘order by。
如果是count distinct内存不够，推荐使用一些预估函数(如果业务场景允许)，这样不仅可以减少内存的使用同时还会提示查询速度。

2.1 问题再现

↑ Progress: 157.94 million rows, 6.91 GB (92.63 thousand rows/s., 4.05 MB/s.) Received exception from server (version 19.4.0):
Code: 319. DB::Exception: Received from 10.0.0.50:9000. DB::Exception: Unknown status, client must retry. Reason: Connection loss.

↖ Progress: 94.47 million rows, 4.18 GB (95.07 thousand rows/s., 4.20 MB/s.) Received exception from server (version 19.4.0):
Code: 999. DB::Exception: Received from 10.0.0.50:9000. DB::Exception: Cannot allocate block number in ZooKeeper: Coordination::Exception: Connection loss.

lineorder_flat_all.Distributed.DirectoryMonitor: Code: 225, e.displayText() = DB::Exception: Received from ambari02:9000, 10.0.0.52. DB::Exception: ZooKeeper session has been expired.. Stack trace:

2.2 分析问题

根据报错信息可知，是因为与Zookeeper的连接丢失导致不能分配块号等问题。因为clickhouse对zookeeper的依赖非常的重，表的元数据信息，每个数据块的信息，每次插入的时候，数据同步的时候，都需要和zookeeper进行交互。zookeerper 服务在同步日志过程中，会导致ZK无法响应外部请求，进而引发session过期等问题。

2.3 解决问题

加大zookeeper会话最大超时时间，在zoo.cfg 中修改MaxSessiOnTimeout=120000，修改后重启zookeeper。
注意：zookeeper的超时时间不要设置太大，在服务挂掉的情况下，会反映很慢。
zookeeper的snapshot文件存储盘不低于1T，注意清理策略
在zookeeper中将dataLogDir存放目录应该与dataDir分开，可单独采用一套存储设备来存放ZK日志。
在ZOO.CFG中增加：forceSync=no。默认是开启的，为避免同步延迟问题，ZK接收到数据后会立刻去将当前状态信息同步到磁盘日志文件中，同步完成后才会应答。将此项关闭后，客户端连接可以得到快速响应。关闭forceSync选项后，会存在潜在风险，虽然依旧会刷磁盘（log.flush()首先被执行），但因为操作系统为提高写磁盘效率，会先写缓存，当机器异常后，可能导致一些zk状态信息没有同步到磁盘，从而带来ZK前后信息不一样问题。
建表的时候添加use_minimalistic_part_header_in_zookeeper参数，对元数据进行压缩存储，但是修改完了以后无法再回滚的哦。

3.1 问题再现

lineorder_flat_all.Distributed.DirectoryMonitor: Code: 242, e.displayText() = DB::Exception: Received from ambari04:9000, 10.0.0.54. DB::Exception: Table is in readonly mode. Stack trace:

3.2 分析问题

因为zookeeper集群出问题(例如zk服务挂了)导致的压力太大，表处于“read only mode”模式，导致插入失败。

3.3 解决问题

做好zookeeper集群和clickhouse集群的规划，可以多套zookeeper集群服务一套clickhouse集群。
zookeeper机器的snapshot文件和log文件最好分盘存储(推荐SSD)提高ZK的响应；
在zoo.cfg中增加forceSync=no。解释同上2.3。

4.1 问题再现

Cannot create table from metadata file /var/lib/clickhouse/metadata/xx/xxx.sql, error: Coordination::Exception: Can’t get data for node /clickhouse/tables/xx/cluster_xxx-01/xxxx/metadata: node doesn’t exist (No node), stack trace:

4.2 分析问题

因为zookeeper数据丢失，从而使clickhouse数据库无法启动。

4.3 解决问题

将/var/lib/clickhouse/metadata/ 下的SQL与/var/lib/clickhouse/data/ 下的数据备份之后删除；
启动数据库；
创建与原来表数据结构的MergeTree表；
将之前分布式表的数据文件夹复制到新表的数据目录中；
重启数据库；
重新创建原结构本地表；
重新创建原结构分布式表；
insert into [分布式表] select * from [MergeTree表]。

5.1 问题再现

DB::NetException: Connection reset by peer, while reading from socket xxx

5.2 分析问题

查询过程中clickhouse-server进程挂掉。

5.3 解决问题

排查发现在这个异常抛出的时间点有出现clickhouse-server的重启，通过监控系统看到机器的内存使用在该时间点出现高峰，在初期集群"裸奔"的时期，很多内存参数都没有进行限制，导致clickhouse-server内存使用量太高被OS KILL掉。max_memory_usage_for_all_queries该参数没有正确设置是导致该case触发的主要原因。

6.1 问题再现

An error occured before execution: Code: 371, e.displayText() = DB::Exception: Table 'test01' isn't replicated, but shard #1 is replicated according to its cluster definition (version 19.14.6.12)

6.2 分析问题

只有使用了replicated开头的engine的引擎的表, 才能够在拥有on cluster xxx条件的ddl语句中进行集群更新；其他engine的表, 只能够每个node进行update；distributed_table使用的是Distributed引擎, 所以也不支持on cluster xxx这样条件的ddl语句。

6.3 解决问题

如果是分布式表：

每个节点执行语句

如果是local表：

每个节点执行语句
换用replicated的表引擎

7.1 问题再现

zookeeper的snapshot文件太大，follower从leader同步文件时超时

7.2 分析问题

上面有说过clickhouse对zookeeper的依赖非常的重，表的元数据信息，每个数据块的信息，每次插入的时候，数据同步的时候，都需要和zookeeper进行交互，上面存储的数据非常的多。

7.3 解决问题

zookeeper的snapshot文件存储盘不低于1T，注意清理策略，不然磁盘报警报到你怀疑人生，如果磁盘爆了那集群就处于“残废”状态；
zookeeper集群的znode最好能在400w以下；
建表的时候添加use_minimalistic_part_header_in_zookeeper参数。

8.1 问题再现

Too many parts(304). Merges are processing significantly slower than inserts

8.2 分析问题

因为MergeTree的merge的速度跟不上目录生成的速度, 数据目录越来越多就会抛出这个异常, 所以一般情况下遇到这个异常，降低一下插入频次就ok了，单纯调整background_pool_size的大小是治标不治本的。

8.3 解决问题

详情请点击：ClickHouse新功能之WAL

9.1 问题再现

ClickHouse exception, code: 48, host: 172.16.8.84, port: 8123; Code: 48, e.displayText() = DB::Exception: There was an error on [172.16.8.84:9000]: Cannot execute replicated DDL query on leader (version 19.14.6.12)

9.2 分析问题

这个问题我自己没有弄明白, 查了非常多的资料, 各执一词。在20.4及以后版本的一个pr修复了相关的问题。

9.3 解决问题

推荐升级到v20.8LTS版本。
如果不支持升级CH版本, 我尝试在低版本上为每个分片加了一个副本也将这个问题解决了(原先的架构是无副本的)。

10.1 问题再现

10.2 分析问题

这个问题我自己也没有弄明白, 显示是数据查询0 rows。官方文档解释如下

SELECT query from MaterializeMySQL tables has some specifics:
If _version is not specified in the SELECT query, FINAL modifier is used. So only rows with MAX(_version) are selected.
If _sign is not specified in the SELECT query, WHERE _sign=1 is used by default. So the deleted rows are not included into the result set.

10.3 解决问题

以上报错信息，有更多见解的大佬，欢迎私信。

上一篇：ClickHouse 之 Server Settings

近期推荐文章：

ClickHouse优化典藏

CllickHouse 部署架构和国内大厂应用实践

ClickHouse (MATERIALIZED) VIEW

更多精彩内容欢迎关注微信公众号

推荐阅读

range
物化视图统计信息引发的查询性能问题及解决方案

本文探讨了一起由物化视图统计信息不当引起的查询性能下降问题，并详细介绍了问题的诊断与解决方法。通过调整统计信息收集策略，最终显著提升了查询效率。 ... [详细]

蜡笔小新 2024-12-01 11:09:44
go
解决Windows 2003上MySQL连接失败的问题

本文详细探讨了在Windows Server 2003环境下遇到MySQL连接失败（错误代码10061）的解决方案，包括通过卸载特定的Windows更新和调整系统注册表设置的方法。 ... [详细]

蜡笔小新 2024-12-03 19:23:31
io
利用 Linux 构建高效网络路由器

本文介绍了如何在 Linux 系统上构建网络路由器，特别关注于使用 Zebra 软件实现动态路由功能。通过具体的案例，展示了如何配置 RIP 和 OSPF 协议，以及如何利用多路由器查看工具（MRLG）监控网络状态。 ... [详细]

蜡笔小新 2024-12-03 17:33:54
heap
深入理解JVM内存区域与配置优化

本文详细介绍了Java虚拟机（JVM）内存区域的划分及其背后的原理，重点探讨了不同内存区域的功能及垃圾回收策略。文章还提供了如何通过JVM参数优化内存管理的实用建议。 ... [详细]

蜡笔小新 2024-12-03 17:31:44
datetime
mysql 分库分表策略_【数据库】分库分表策略

关系型数据库本身比较容易成为系统瓶颈，单机存储容量、连接数、处理能力都有限。当单表的数据量达到1000W或100G以后，由于查询维度较多， ... [详细]

蜡笔小新 2024-12-03 13:09:47
io
databasesync适配openGauss使用指导书

一、database-sync简介database-sync作为一种开源辅助工具，用于数据库之间的表同步，更确切的说法是复制，可以从一个数据库复制表到另一个数据库该工具支持的功能如 ... [详细]

蜡笔小新 2024-12-02 18:31:18
go
服务器与应用系统迁移策略

本文档详细介绍了服务器与应用系统迁移的策略与实施步骤。迁移不仅涉及数据的转移，还包括环境配置、应用兼容性测试等多个方面，旨在确保迁移过程的顺利进行及迁移后的系统稳定运行。 ... [详细]

蜡笔小新 2024-12-02 17:21:37
include
解决PHP与MySQL之间的编码不匹配问题

探讨如何有效解决PHP与MySQL之间常见的编码问题，确保数据的正确传输与显示。 ... [详细]

蜡笔小新 2024-12-02 16:10:23
go
使用Docker部署Gitea自托管Git服务

Gitea是由Gogs社区分叉而来的开源自托管Git服务，旨在提供一个更加灵活和易于维护的解决方案。本文将详细介绍如何利用Docker容器技术快速部署Gitea。 ... [详细]

蜡笔小新 2024-12-02 15:35:13
window
使用JavaScript为ASP.NET DropDownList控件设置默认值

本文介绍如何利用JavaScript在页面加载时为ASP.NET的DropDownList控件设置特定的选项值。 ... [详细]

蜡笔小新 2024-12-01 22:26:31
io
MyBatis入门指南

本文详细介绍了MyBatis的基础知识，包括如何整合日志框架（如log4j和logback），使用外部JDBC文件，getMapper()方法的应用，以及别名设置等技巧。 ... [详细]

蜡笔小新 2024-12-01 21:38:33
io
解决getallheaders函数导致的500错误及8种服务器性能优化策略

本文探讨了解决getallheaders函数引起的服务器500错误的方法，并介绍八种有效的服务器性能优化技术，包括内存数据库的应用、Spark RDD的使用、缓存策略的实施、SSD的引入、数据库优化、IO模型的选择、多核处理策略以及分布式部署方案。 ... [详细]

蜡笔小新 2024-12-03 18:26:35
main
使用DataGridViewComboBoxColumn实现数据绑定与操作

本文详细介绍如何在DataGridView中使用DataGridViewComboBoxColumn来加载、选择和保存数据库中的数据，提供具体的实现步骤和示例代码。 ... [详细]

蜡笔小新 2024-12-03 18:21:44
io
GBae 8s SQL 指南：SAVEPOINT语句详解

本文详细介绍了如何在SQL查询中使用SAVEPOINT语句进行事务管理，以及如何通过多列排序增强查询结果的组织性。例如，通过在ORDER BY子句中指定多个列，可以实现更加细致和灵活的数据排序。 ... [详细]

蜡笔小新 2024-12-03 17:34:49
io
Web安全入门：MySQL基础操作与SQL注入防范

本文详细介绍了MySQL数据库的基础操作命令，包括数据库和表的基本管理，以及数据的增删查改等常用操作。同时，针对Web安全领域常见的SQL注入问题，提供了初步的理解和防范措施。 ... [详细]

蜡笔小新 2024-12-03 14:00:48

hgsfaerqw_504

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章