热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

同学,你听说过MOT吗?

本文介绍了openGauss内存优化表(Memory-OptimizedTable,MOT)的特性及价

本文介绍了openGauss内存优化表(Memory-Optimized Table,MOT)的特性及价值、应用场景及部署。

MOT简介

openGauss引入了MOT存储引擎,它是一种事务性行存储,针对多核和大内存服务器进行了优化。MOT是openGauss数据库最先进的生产级特性(Beta版本),它为事务性工作负载提供更高的性能。MOT完全支持ACID特性,并包括严格的持久性和高可用性支持。企业可以在关键任务、性能敏感的在线事务处理(OLTP)中使用MOT,以实现高性能、高吞吐、可预测低延迟以及多核服务器的高利用率。MOT尤其适合在多路和多核处理器的现代服务器上运行,例如基于Arm/鲲鹏处理器的华为TaiShan服务器,以及基于x86的戴尔或类似服务器。
图 1 openGauss内存优化存储引擎

如图1所示,openGauss数据库内存优化存储引擎组件(绿色部分)负责管理MOT和事务。
MOT与基于磁盘的普通表并排创建。MOT的有效设计实现了几乎完全的SQL覆盖,并且支持完整的数据库功能集,如存储过程和自定义函数(限制参见MOT SQL覆盖和限制)。
通过完全存储在内存中的数据和索引、非统一内存访问感知(NUMA-aware)设计、消除锁和锁存争用的算法以及查询原生编译,MOT可提供更快的数据访问和更高效的事务执行。
MOT有效的几乎无锁的设计和高度调优的实现,使其在多核服务器上实现了卓越的近线性吞吐量扩展,这可能是业界最好的。
MOT完全支持ACID特性:
原子性(Atomicity):原子事务是一系列不可分割的数据库操作。在事务完成(分别提交或中止)之后,这些操作要么全部发生,要么全部不发生。
一致性(Consistency):事务结束后,数据库处于一致状态,保留数据完整性。
隔离性(Isolation):事务之间不能相互干扰。MOT支持不同的重复读和读提交隔离级别。在下一个版本中,MOT还将支持可序列化隔离。更多信息,请参见MOT隔离级别。
持久性(Durability):即使发生崩溃和失败,成功完成(提交)的事务效果持久保存。MOT完全集成了openGauss的基于WAL的日志记录。同时支持同步和异步日志记录选项。MOT还支持同步+面向NUMA优化的组提交。更多信息,请参见MOT持久性概念。

MOT应用场景

MOT可以根据负载的特点,显著加快应用程序的整体性能。MOT通过提高数据访问和事务执行的效率,并通过消除并发执行事务之间的锁和锁存争用,最大程度地减少重定向,从而提高了事务处理的性能。
MOT的极速不仅因为它在内存中,还因为它围绕并发内存使用管理进行了优化。数据存储、访问和处理算法从头开始设计,以利用内存和高并发计算的最新先进技术。
openGauss允许应用程序随意组合MOT和基于标准磁盘的表。对于启用已证明是瓶颈的最活跃、高争用和对性能敏感的应用程序表,以及需要可预测的低延迟访问和高吞吐量的表来说,MOT特别有用。
MOT可用于各种应用,例如:
高吞吐事务处理:这是使用MOT的主要场景,因为它支持海量事务,同时要求单个事务的延迟较低。这类应用的例子有实时决策系统、支付系统、金融工具交易、体育博彩、移动游戏、广告投放等。
性能瓶颈加速:存在高争用现象的表可以通过使用MOT受益,即使该表是磁盘表。由于延迟更低、竞争和锁更少以及服务器吞吐量能力增加,此类表(除了相关表和在查询和事务中一起引用的表之外)的转换使得性能显著提升。
消除中间层缓存:云计算和移动应用往往会有周期性或峰值的高工作负载。此外,许多应用都有80%以上负载是读负载,并伴有频繁的重复查询。为了满足峰值负载单独要求,以及降低响应延迟提供最佳的用户体验,应用程序通常会部署中间缓存层。这样的附加层增加了开发的复杂性和时间,也增加了运营成本。MOT提供了一个很好的替代方案,通过一致的高性能数据存储来简化应用架构,缩短开发周期,降低CAPEX和OPEX成本。
大规模流数据提取:MOT可以满足云端(针对移动、M2M和物联网)、事务处理(Transactional Processing,TP)、分析处理(Analytical Processing,AP)和机器学习(Machine Learning,ML)的大规模流数据的提取要求。MOT尤其擅长持续快速地同时提取来自许多不同来源的大量数据。这些数据可以在以后进行处理、转换,并在速度较慢的基于磁盘的表中进行移动。另外,MOT还可以查询到一致的、最新的数据,从而得出实时结果。在有许多实时数据流的物联网和云计算应用中,通常会有专门的数据摄取和处理。例如,一个Apache Kafka集群可以用来提取10万个事件/秒的数据,延迟为10ms。一个周期性的批处理任务会将收集到的数据收集起来,并将转换格式,放入关系型数据库中进行进一步分析。MOT可以通过将数据流直接存储在MOT关系表中,为分析和决策做好准备,从而支持这样的场景(同时消除单独的数据处理层)。这样可以更快地收集和处理数据,MOT避免了代价高昂的分层和缓慢的批处理,提高了一致性,增加了分析数据的实时性,同时降低了总拥有成本(Total Cost of Ownership,TCO)。
降低TCO:提高资源利用率和消除中间层可以节省30%到90%的TCO。友商案例:MemSQL、Azure。

部署MOT

以下各小节介绍了各种必需和可选的设置,以达到最佳部署效果。

MOT服务器优化:x86

通常情况下,数据库由以下组件绑定:

  • CPU:更快的CPU可以加速任何CPU绑定的数据库。
  • 磁盘:高速SSD/NVME可加速任何I/O绑定数据库。
  • 网络:更快的网络可以加速任何SQL*Net绑定数据库。
除以上内容外,以下通用服务器设置默认使用,可能会明显影响数据库的性能。
MOT性能调优是确保快速的应用程序功能和数据检索的关键步骤。MOT支持最新的硬件,因此调整每个系统以达到最大吞吐量是极为重要的。
以下是用于优化在英特尔x86服务器上运行MOT时的建议配置。这些设置是高吞吐量工作负载的最佳选择。

BIOS
Hyper Threading设置为ON。
强烈建议打开超线程(HT=ON)。
建议在MOT上运行OLTP工作负载时打开超线程。当使用超线程时,某些OLTP工作负载显示高达40%的性能增益。

操作系统环境设置

  • NUMA

    禁用NUMA平衡,如下所示。MOT以极其高效的NUMA-aware方式进行内存管理,远远超过操作系统使用的默认方法。

    echo 0 > /proc/sys/kernel/numa_balancing

  • 服务

    禁用如下服务:

    service irqbalance stop # MANADATORY
    service sysmonitor stop # OPTIONAL, performance
    service rsyslog stop # OPTIONAL, performance

  • 调优服务

    以下为必填项。

    服务器必须运行throughput-performance配置文件。

    [...]$ tuned-adm profile throughput-performance

    throughput-performance配置文件是广泛适用的调优,它为各种常见服务器工作负载提供卓越的性能。

    其他不太适合openGauss和MOT服务器的配置可能会影响MOT的整体性能,包括:平衡配置、桌面配置、延迟性能配置、网络延迟配置、网络吞吐量配置和节能配置。

  • 系统命令

    推荐使用下列操作系统设置以获得最佳性能。

    • 在/etc/sysctl.conf文件中添加如下配置,然后执行sysctl -p命令:

      net.ipv4.ip_local_port_range = 9000 65535
      kernel.sysrq = 1
      kernel.panic_on_oops = 1
      kernel.panic = 5
      kernel.hung_task_timeout_secs = 3600
      kernel.hung_task_panic = 1
      vm.oom_dump_tasks = 1
      kernel.softlockup_panic = 1
      fs.file-max = 640000
      kernel.msgmnb = 7000000
      kernel.sched_min_granularity_ns = 10000000
      kernel.sched_wakeup_granularity_ns = 15000000
      kernel.numa_balancing=0
      vm.max_map_count = 1048576
      net.ipv4.tcp_max_tw_buckets = 10000
      net.ipv4.tcp_tw_reuse = 1
      net.ipv4.tcp_tw_recycle = 1
      net.ipv4.tcp_keepalive_time = 30
      net.ipv4.tcp_keepalive_probes = 9
      net.ipv4.tcp_keepalive_intvl = 30
      net.ipv4.tcp_retries2 = 80
      kernel.sem = 250 6400000 1000 25600
      net.core.wmem_max = 21299200
      net.core.rmem_max = 21299200
      net.core.wmem_default = 21299200
      net.core.rmem_default = 21299200
      #net.sctp.sctp_mem = 94500000 915000000 927000000
      #net.sctp.sctp_rmem = 8192 250000 16777216
      #net.sctp.sctp_wmem = 8192 250000 16777216
      net.ipv4.tcp_rmem = 8192 250000 16777216
      net.ipv4.tcp_wmem = 8192 250000 16777216
      net.core.somaxconn = 65535
      vm.min_free_kbytes = 26351629
      net.core.netdev_max_backlog = 65535
      net.ipv4.tcp_max_syn_backlog = 65535
      #net.sctp.addip_enable = 0
      net.ipv4.tcp_synCOOKIEs = 1
      vm.overcommit_memory = 0
      net.ipv4.tcp_retries1 = 5
      net.ipv4.tcp_syn_retries = 5

    • 按如下方式修改/etc/security/limits.conf对应部分:

      soft nofile 100000
      hard nofile 100000

      软限制和硬限制设置可指定一个进程同时打开的文件数量。软限制可由各自运行这些限制的进程进行更改,直至达到硬限制值。

  • 磁盘/SSD

    下面以数据库同步提交模式为例,介绍如何保证磁盘读写性能适合数据库同步提交模式。

    按如下方式运行磁盘/SSD性能测试:

    [...]$ sync; dd if=/dev/zero of=testfile bs=1M count=1024; sync
    1024+0 records in
    1024+0 records out
    1073741824 bytes (1.1 GB) copied, 1.36034 s, 789 MB/s

    当磁盘带宽明显低于789MB/s时,可能会造成openGauss性能瓶颈,尤其是造成MOT性能瓶颈。

网络

需要使用10Gbps以上网络。

运行iperf命令进行验证:

Server side: iperf -s
Client side: iperf -c

rc.local:网卡调优

以下可选设置对性能有显著影响:
  1. 将set_irq_affinity.sh · GitHub下的set_irq_privacy.sh文件拷贝到/var/scripts/目录下。
  2. 进入/etc/rc.d/rc.local,执行chmod命令,确保在boot时执行以下脚本:

    'chmod +x /etc/rc.d/rc.local'
    var/scripts/set_irq_affinity.sh -x all
    ethtool -K gro off
    ethtool -C adaptive-rx on adaptive-tx on
    Replace with the network card, i.e. ens5f1

MOT服务器优化:基于Arm的华为TaiShan2P/4P服务器

以下是基于Arm/鲲鹏架构的华为TaiShan 2280 v2服务器(2路128核)和TaiShan 2480 v2服务器(4路256核)上运行MOT时的建议配置。

除非另有说明,以下设置适用于客户端和服务器的机器。

BIOS

修改BIOS相关设置:

  1. 选择 BIOS > Advanced > MISC Config。设置 Support Smmu 为 Disabled。
  2. 选择 BIOS > Advanced > MISC Config。设置 CPU Prefetching Configuration 为 Disabled。


  3. 选择 BIOS > Advanced > Memory Config。设置 Die Interleaving 为 Disabled 。


  4. 选择 BIOS > Advanced > Performance Config。设置 Power Policy 为 Performance


操作系统:内核和启动

  • 以下操作系统内核和启动参数通常由sysadmin配置。

    配置内核参数,如下所示。

    net.ipv4.ip_local_port_range = 9000 65535
    kernel.sysrq = 1
    kernel.panic_on_oops = 1
    kernel.panic = 5
    kernel.hung_task_timeout_secs = 3600
    kernel.hung_task_panic = 1
    vm.oom_dump_tasks = 1
    kernel.softlockup_panic = 1
    fs.file-max = 640000
    kernel.msgmnb = 7000000
    kernel.sched_min_granularity_ns = 10000000
    kernel.sched_wakeup_granularity_ns = 15000000
    kernel.numa_balancing=0
    vm.max_map_count = 1048576
    net.ipv4.tcp_max_tw_buckets = 10000
    net.ipv4.tcp_tw_reuse = 1
    net.ipv4.tcp_tw_recycle = 1
    net.ipv4.tcp_keepalive_time = 30
    net.ipv4.tcp_keepalive_probes = 9
    net.ipv4.tcp_keepalive_intvl = 30
    net.ipv4.tcp_retries2 = 80
    kernel.sem = 32000 1024000000 500 32000
    kernel.shmall = 52805669
    kernel.shmmax = 18446744073692774399
    sys.fs.file-max = 6536438
    net.core.wmem_max = 21299200
    net.core.rmem_max = 21299200
    net.core.wmem_default = 21299200
    net.core.rmem_default = 21299200
    net.ipv4.tcp_rmem = 8192 250000 16777216
    net.ipv4.tcp_wmem = 8192 250000 16777216
    net.core.somaxconn = 65535
    vm.min_free_kbytes = 5270325
    net.core.netdev_max_backlog = 65535
    net.ipv4.tcp_max_syn_backlog = 65535
    net.ipv4.tcp_synCOOKIEs = 1
    vm.overcommit_memory = 0
    net.ipv4.tcp_retries1 = 5
    net.ipv4.tcp_syn_retries = 5
    ##NEW
    kernel.sched_autogroup_enabled=0
    kernel.sched_min_granularity_ns=2000000
    kernel.sched_latency_ns=10000000
    kernel.sched_wakeup_granularity_ns=5000000
    kernel.sched_migration_cost_ns=500000
    vm.dirty_background_bytes=33554432
    kernel.shmmax=21474836480
    net.ipv4.tcp_timestamps = 0
    net.ipv6.conf.all.disable_ipv6=1
    net.ipv6.conf.default.disable_ipv6=1
    net.ipv4.tcp_keepalive_time=600
    net.ipv4.tcp_keepalive_probes=3
    kernel.core_uses_pid=1

  • 调优服务

    以下为必填项。

    服务器必须运行throughput-performance配置文件:

    [...]$ tuned-adm profile throughput-performance

    throughput-performance配置文件是广泛适用的调优,它为各种常见服务器工作负载提供卓越的性能。

    其他不太适合openGauss和MOT服务器的配置可能会影响MOT的整体性能,包括:平衡配置、桌面配置、延迟性能配置、网络延迟配置、网络吞吐量配置和节能配置。

  • 启动调优

    在内核启动参数中添加iommu.passthrough=1。

    在pass-through模式下运行时,适配器需要DMA转换到内存,从而提高性能。

MOT配置

预置MOT用于创建工作MOT。为了获得最佳效果,建议根据应用程序的特定要求和偏好自定义MOT配置(在mot.conf文件中定义)。
该文件在服务器启动时只读。如果在系统运行中编辑此文件,则必须重新加载服务器才能使修改内容生效。
mot.conf文件与postgresql.conf配置文件在同一文件夹下。
在主备部署模式下,主备节点的mot.conf文件需要完全相同,否则,系统行为不明确。
阅读总体原则,根据需要查看和配置mot.conf文件。

 说明: 以上描述了mot.conf文件中的各个设置。除上述内容外,要了解特定MOT功能(如恢复),可参考本用户手册的相关章节。例如,MOT恢复说明了mot.conf文件的恢复,包含影响MOT恢复的设置。此外,有关恢复的完整说明,请参阅“MOT管理”章节的MOT恢复。下文各相关章节中还提供了参考链接。

以下介绍了mot.conf文件中的各个部分,其包含的设置以及默认值。

总体原则

以下是编辑mot.conf文件的总体原则。

  •  每个设置项都带有默认值,如下所示

    # name = value

  • 可以接受空格或留空。 

  • 在各行添加#号可进行注释。

  • 每个设置项的默认值将作为注释显示在整个文件中。

  • 如果参数没有注释并且置入了新值,则定义新设置。

  • 对mot.conf文件的更改仅在数据库服务器启动或重装时生效。

内存单元的表示如下:

  • KB:千字节
  • MB:兆字节
  • GB:吉字节
  • TB:太字节
如果未指定内存单元,则假定为字节。
某些内存单位为postgresql.conf中的max_process_memory的百分比值。例如,20%。
时间单位表示如下:
  • us:微秒
  • ms:毫秒
  • s:秒
  • min:分钟
  • h:小时
  • d:天
如果未指定时间单位,则假定为微秒。

重做日志(MOT)

  • enable_group_commit = false

    是否使用组提交。

    该选项仅在openGauss配置为使用同步提交时相关,即仅当postgresql.conf中的synchronization_commit设置为除off以外的任何值时相关。

    有关WAL重做日志的详细信息,请参阅MOT日志记录:WAL重做日志。

  • group_commit_size = 16
  • group_commit_timeout = 10 ms

    只有当MOT引擎配置为同步组提交日志记录时,此选项才相关。即postgresql.conf中的synchronization_commit配置为true,mot.conf配置文件中的enable_group_commit配置为true。

    当一组事务记录在WAL重做日志中时,需确定以下设置项取值:

    group_commit_size:一组已提交的事务数。例如,16表示当同一组中的16个事务已由它们的客户端应用程序提交时,则针对16个事务中的每个事务,在磁盘的WAL重做日志中写入一个条目。

    group_commit_timeout:超时时间,单位为毫秒。例如,10表示在10毫秒之后,为同一组由客户端应用程序在最近10毫秒内提交的每个事务,在磁盘的WAL重做日志中写入一个条目。

    提交组在到达配置的事务数后或者在超时后关闭。组关闭后,组中的所有事务等待一个组落盘完成执行,然后通知客户端每个事务都已经结束。

    有关同步组提交日志记录的详细信息,请参阅MOT日志类型。

检查点(MOT)

  • checkpoint_dir =

    指定检查点数据存放目录。默认位置在每个数据节点的data文件夹中。

  • checkpoint_segsize = 16 MB

    指定检查点时使用的段大小。分段执行检查点。当一个段已满时,它将被序列化到磁盘,并为后续的检查点数据打开一个新的段。


  • checkpoint_workers = 3

    指定在检查点期间要使用的工作线程数。

恢复(MOT)
checkpoint_recovery_workers = 3
指定在检查点数据恢复期间要使用的工作线程数。每个MOT引擎工作线程在自己的核上运行,通过将不同的表读入内存,可以并行处理不同的表。缺省值为3,可将此参数设置为可处理的核数。恢复后,将停止并杀死这些线程。

统计(MOT)

  • enable_stats = false

    设置周期性统计打印信息。

  • print_stats_period = 10 minute

    设置汇总统计报表打印的时间范围。

  • print_full_stats_period = 1 hours

    设置全量统计报表打印的时间范围。

    以下设置为周期性统计报表中的各个部分。如果没有配置,则抑制统计报表。

  • enable_log_recovery_stats = false

    日志恢复统计信息包含各种重做日志的恢复指标。

  • enable_db_session_stats = false

    数据库会话统计信息包含事务事件,如提交、回滚等。

  • enable_network_stats = false

    网络统计信息包括连接/断连事件。



  • enable_log_stats = false

    日志统计信息包含重做日志详情。

  • enable_memory_stats = false

    内存统计信息包含内存层详情。

  • enable_process_stats = false

    进程统计信息包含当前进程的内存和CPU消耗总量。


  • enable_system_stats = false

    系统统计信息包含整个系统的内存和CPU消耗总量。



  • enable_jit_stats = falseJIT

    统计信息包含有关JIT查询编译和执行的信息。

错误日志(MOT)

  • log_level = INFO
    设置MOT引擎下发的消息在数据库服务器的错误日志中记录的日志级别。有效值为PANIC、ERROR、WARN、INFO、TRACE、DEBUG、DIAG1、DIAG2。

  • Log/COMPONENT/LOGGER=LOG_LEVEL
    使用以下语法设置特定的日志记录器。
    例如,要为系统组件中的ThreadIdPool日志记录器配置TRACE日志级别,请使用以下语法:

    Log.System.ThreadIdPool.log_level=TRACE

    要为某个组件下的所有记录器配置日志级别,请使用以下语法:

    Log.COMPONENT.log_level=LOG_LEVEL

      例如:

    Log.System.log_level=DEBUG

内存(MOT)

  • enable_numa = true

    指定是否使用可识别NUMA的内存。禁用时,所有亲和性配置也将被禁用。MOT引擎假定所有可用的NUMA节点都有内存。如果计算机具有某些特殊配置,其中某些NUMA节点没有内存,则MOT引擎初始化将因此失败,因此数据库服务器启动将失败。在此类计算机中,建议将此配置值设置为false,以防止启动失败并让MOT引擎在不使用可识别NUMA的内存分配的情况下正常运行。

  • affinity_mode = fill-physical-first

    设置用户会话和内部MOT任务的线程亲和模式。

    使用线程池时,用户会话将忽略此值,因为它们的亲和性由线程池控制。但内部MOT任务仍然使用。

    有效值为fill-socket-first、equal-per-socket、fill-physical-first、none。

    • Fill-socket-first将线程连接到同一个槽位的核上,直到槽位已满,然后移动到下一个槽位。
    • Equal-per-socket使线程均匀分布在所有槽位中。
    • Fill-physical-first将线程连接到同一个槽位中的物理核,直到用尽所有物理核,然后移动到下一个槽位。当所有物理核用尽时,该过程再次从超线程核开始。
    • None禁用任何亲和配置,并让系统调度程序确定每个线程调度在哪个核上运行。
  • lazy_load_chunk_directory = true

    设置块目录模式,用于内存块查找。
    Lazy模式将块目录设置为按需加载部分目录,从而减少初始内存占用(大约从1GB减少到1MB)。然而,这可能会导致轻微的性能损失和极端情况下的内存损坏。相反,使用non-lazy块目录会额外分配1GB的初始内存,产生略高的性能,并确保在内存损坏期间避免块目录错误。

  • reserve_memory_mode = virtual

    设置内存预留模式(取值为physical或virtual)。

    每当从内核分配内存时,都会参考此配置值来确定所分配的内存是常驻(physical)还是非常驻(virtual)。这主要与预分配有关,但也可能影响运行时分配。对于physical保留模式,通过强制内存区域所跨越的所有页出现页错误,使整个分配的内存区域常驻。配置virtual内存预留可加速内存分配(特别是在预分配期间),但可能在初始访问期间出现页错误(因此导致轻微的性能影响),并在物理内存不可用时出现更多服务器错误。相反,物理内存分配速度较慢,但后续访问速度更快且有保障。

  • store_memory_policy = compact

    设置内存存储策略(取值为compact或expanding)。

    当定义了compact策略时,未使用的内存会释放回内核,直到达到内存下限(请参见下面的min_mot_memory)。在expanding策略中,未使用的内存存储在MOT引擎中,以便后续再使用。compact存储策略可以减少MOT引擎的内存占用,但偶尔会导致性能轻微下降。此外,在内存损坏时,它还可能导致内存不可用。相反,expanding模式会占用更多的内存,但是会更快地分配内存,并且能够更好地保证在解分配后能够重新分配内存。

  • chunk_alloc_policy = auto

    设置全局内存的块分配策略。
    MOT内存以2MB的块为单位组织。源NUMA节点和每个块的内存布局会影响表数据在NUMA节点间的分布,因此对数据访问时间有很大影响。在特定NUMA节点上分配块时,会参考分配策略。
    可用值包括auto、local、page-interleaved、chunk-interleaved、native。

    • Auto策略根据当前硬件情况选择块分配策略。
    • Local策略在各自的NUMA节点上分配每个数据块。
    • Page-interleaved策略从所有NUMA节点分配由交插内存4千字节页组成的数据块。
    • Chunk-interleaved策略以轮循调度方式从所有NUMA节点分配数据块。
    • Native策略通过调用原生系统内存分配器来分配块。
  • chunk_prealloc_worker_count = 8

    设置每个NUMA节点参与内存预分配的工作线程数。

  • max_mot_global_memory = 80%

    设置MOT引擎全局内存的最大限制。

    指定百分比值与postgresql.conf中max_process_memory定义的总量有关。

    MOT引擎内存分为全局(长期)内存,主要用于存储用户数据,以及本地(短期)内存,主要用于用户会话,以满足本地需求。

    任何试图分配超出此限制的内存的尝试将被拒绝,并向用户报告错误。请确保max_mot_global_memory与max_mot_local_memory之和不超过postgresql.conf中配置的max_process_memory。

  • min_mot_global_memory = 0 MB

    设置MOT引擎全局内存的最小限制。

    指定百分比值与postgresql.conf中max_process_memory定义的总量有关。


    此值用于启动期间的内存预分配,以及确保MOT引擎在正常运行期间有最小的内存可用量。当使用compact存储策略时(参阅上文store_memory_policy),该值指定了下限,超过下限的内存不会释放回内核,而是保留在MOT引擎中以便后续重用。


  • max_mot_local_memory = 15%

    设置MOT引擎本地内存的最大限制。

    指定百分比值与postgresql.conf中max_process_memory定义的总量有关。

    MOT引擎内存分为全局(长期)内存,主要用于存储用户数据,以及本地(短期)内存,主要用于用户会话,以满足本地需求。

    任何试图分配超出此限制的内存的尝试将被拒绝,并向用户报告错误。请确保max_mot_global_memory与max_mot_local_memory之和不超过postgresql.conf中配置的max_process_memory。

  • min_mot_local_memory = 0 MB

    设置MOT引擎本地内存的最小限制。

    指定百分比值与postgresql.conf中max_process_memory定义的总量有关。

    此值用于在启动期间预分配内存,以及确保MOT引擎在正常运行期间有最小的可用内存。当使用compact存储策略时(参阅上文store_memory_policy),该值指定了下限,超过下限的内存不会释放回内核,而是保留在MOT引擎中以便后续重用。

  • max_mot_session_memory = 0 MB

    设置MOT引擎中单个会话的最大内存限制。

    指定百分比值与postgresql.conf中max_process_memory定义的总量有关。

    通常,MOT引擎中的会话可以根据需要分配尽可能多的本地内存,只要没有超出本地内存限制即可。为了避免单个会话占用过多的内存,从而拒绝其他会话的内存,通过该配置项限制小会话的本地内存分配(最大1022KB)。

    请确保该配置项不影响大会话的本地内存分配。

    0表示不会限制每个小会话的本地分配,除非是由max_mot_local_memory配置的本地内存分配限制引起的。

  • min_mot_session_memory = 0 MB

    设置MOT引擎中单个会话的最小内存预留。

    指定百分比值与postgresql.conf中max_process_memory定义的总量有关。

    此值用于在会话创建期间预分配内存,以及确保会话有最小的可用内存量来执行其正常操作。

  • session_large_buffer_store_size = 0 MB

    设置会话的大缓冲区存储。

    当用户会话执行需要大量内存的查询时(例如,使用许多行),大缓冲区存储用于增加此类内存可用的确定级别,并更快地为这个内存请求提供服务。对于超过1022KB的会话,任何内存分配都是大内存分配。如果未使用或耗尽了大缓冲区存储,则这些分配将被视为直接从内核提供的巨大分配。

  • session_large_buffer_store_max_object_size = 0 MB

    设置会话的大分配缓冲区存储中的最大对象大小。

    大缓冲区存储内部被划分为不同大小的对象。此值用于对源自大缓冲区存储的对象设置上限,以及确定缓冲区存储内部划分为不同大小的对象。

    此大小不能超过session_large_buffer_store_size的1/8。如果超过,则将其调整到最大可能。

  • session_max_huge_object_size = 1 GB

    设置会话单个大内存分配的最大尺寸。

    巨大分配直接从内核中提供,因此不能保证成功。

    此值也适用于全局(非会话相关)内存分配。

垃圾收集(MOT)

  • enable_gc = true

    是否使用垃圾收集器(Garbage Collector,GC)。

  • reclaim_threshold = 512 KB

    设置垃圾收集器的内存阈值。

    每个会话管理自己的待回收对象列表,并在事务提交时执行自己的垃圾回收。此值决定了等待回收的对象的总内存阈值,超过该阈值,会话将触发垃圾回收。

  • reclaim_batch_size = 8000

    设置垃圾回收的批次大小。

    垃圾收集器从对象中批量回收内存,以便限制在一次垃圾收集传递中回收的对象数量。此目的是最小化单个垃圾收集传递的操作时间。
  • high_reclaim_threshold = 8 MB

    设置垃圾回收的高内存阈值。


JIT(MOT)

  • enable_mot_codegen = true

    指定是否对计划查询使用JIT查询编译和执行。

    JIT查询执行为在计划阶段准备好的查询准备了JIT编译的代码。每当调用准备好的查询时,都会执行生成的JIT编译函数。JIT编译通常以LLVM的形式进行。在原生不支持LLVM的平台上,MOT提供了基于软件的回退(Tiny Virtual Machine,TVM)。

  • force_mot_pseudo_codegen = false

    当前平台支持LLVM时,是否使用TVM(伪LLVM)。

    在原生不支持LLVM的平台上,MOT自动默认为TVM。

    在原生支持LLVM的平台上,默认使用LLVM。该配置项允许在支持LLVM的平台上使用TVM进行JIT编译和执行。

  • enable_mot_codegen_print = false

    指定是否为JIT编译的查询打印发出的LLVM/TVM IR代码。

  • mot_codegen_limit = 100

    限制每个用户会话允许的JIT查询数。

默认MOT.conf文件

最小设置和配置指定将postgresql.conf文件指向MOT.conf文件的位置:

postgresql.conf
mot_config_file = '/tmp/gauss/ MOT.conf'

确保max_process_memory设置的值足够包含MOT的全局(数据和索引)和本地(会话)内存。
MOT.conf的默认内容满足开始使用的需求。设置内容后续可以优化。


推荐阅读
  • 基于PgpoolII的PostgreSQL集群安装与配置教程
    本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件,提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能,可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤,并提供了相关的官方参考地址。 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • Linux如何安装Mongodb的详细步骤和注意事项
    本文介绍了Linux如何安装Mongodb的详细步骤和注意事项,同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库,适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作,能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]
  • CentOS 7部署KVM虚拟化环境之一架构介绍
    本文介绍了CentOS 7部署KVM虚拟化环境的架构,详细解释了虚拟化技术的概念和原理,包括全虚拟化和半虚拟化。同时介绍了虚拟机的概念和虚拟化软件的作用。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文由编程笔记小编整理,介绍了PHP中的MySQL函数库及其常用函数,包括mysql_connect、mysql_error、mysql_select_db、mysql_query、mysql_affected_row、mysql_close等。希望对读者有一定的参考价值。 ... [详细]
  • 本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取,用于解析LOCAL_LISTENER,并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例,并展示了listener.ora文件的内容。 ... [详细]
  • 解决Cydia数据库错误:could not open file /var/lib/dpkg/status 的方法
    本文介绍了解决iOS系统中Cydia数据库错误的方法。通过使用苹果电脑上的Impactor工具和NewTerm软件,以及ifunbox工具和终端命令,可以解决该问题。具体步骤包括下载所需工具、连接手机到电脑、安装NewTerm、下载ifunbox并注册Dropbox账号、下载并解压lib.zip文件、将lib文件夹拖入Books文件夹中,并将lib文件夹拷贝到/var/目录下。以上方法适用于已经越狱且出现Cydia数据库错误的iPhone手机。 ... [详细]
  • 本文讨论了在数据库打开和关闭状态下,重新命名或移动数据文件和日志文件的情况。针对性能和维护原因,需要将数据库文件移动到不同的磁盘上或重新分配到新的磁盘上的情况,以及在操作系统级别移动或重命名数据文件但未在数据库层进行重命名导致报错的情况。通过三个方面进行讨论。 ... [详细]
author-avatar
浅唱_夏染_744
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有