#数据库配置调优
# 安装部署YashanDB阶段
在安装部署YashanDB过程中,可以通过使用推荐配置、修改建库参数、资源管理提高数据库性能。
# 初始化配置参数
YashanDB提供了一系列性能参数,可以满足不同硬件环境、不同业务模型下的性能需求。数据库初始化时,应根据应用需求和环境资源,赋予这些参数合适的初始值;同时,在后续的数据库运行过程中,可能需要对这些参数进行调整,以解决某些被识别到的性能瓶颈。
除了在数据库运行过程中,根据识别到的瓶颈进行参数优化之外,数据库在初始化时,也应该根据应用需求,初始化合适的参数值。
下表列示在部署数据库实例时需要重点关注的配置参数,这些参数的初始化值对数据库性能至关重要:
参数名称 | 参数描述 |
---|---|
VM_BUFFER_SIZE | VM用于保存数据运算的中间结果,例如order by,group by。若其配置过小,将容易导致频繁的VM换入换出(产生IO)。 建议根据应用实际需求配置合理的VM大小。 |
REDOFILE_IO_MODE | redo文件的IO模式,不同磁盘在不同IO模式下的性能差异可能比较大,设置合理的IO模式,可以充分发挥磁盘性能。 建议使用默认值,若出现明显的性能问题,可通过性能测试找到合适的IO模式。 |
REDO_BUFFER_SIZE | redo缓存区的大小,设置较大的缓存区可以提高redo刷盘效率和redo回放效率。 建议将REDO_BUFFER_SIZE配置为64M。 |
REDO_BUFFER_PARTS | redo缓存区的分区个数,某个会话产生的redo被哈希分配到唯一的分区,设置合理的分区个数能减少并发冲突。 建议将REDO_BUFFER_PARTS配置为8。 |
SCOL_DATA_BUFFER_SIZE | 可供使用了稳态数据缓冲区的对象(如LSC表)使用的稳态数据缓冲区大小,缓冲区调大可提升读取命中率及LSC表的导入性能。建议将Slice元数据和频繁访问小表都缓存在内存。 HEAP/TAC表情况下,建议将该参数配置为默认值。 LSC表情况下,该参数配置建议参考参数大小。 |
SCOL_CACHEABLE_SCAN_ROWS | LSC表扫描使用稳态数据缓存区的最大记录数,如果查询计划评估扫描记录数超过该值,就不会使用稳态数据缓冲区。 建议根据稳态数据缓存区大小、当前业务的缓存效果以及整体查询性能调整配置。 |
DBWR_COUNT | Database Writer用于将数据库产生的脏块刷新到磁盘,此参数用于配置Database Writer的数量,一般情况下(尤其是SSD盘),提高Database Writer的数量,可以提升IO的效率。 建议根据实际硬件环境和业务压力配置合适的Database Writer数量。 |
DB_BLOCK_SIZE | 组织数据的块大小,包括文件中以及Data Buffer中的块大小,YashanDB提供8K,16K,32K三种不同规格的块大小供设置。 小的数据块可以降低高并发下的数据访问冲突,大的数据块可以提升IO效率。因此建议事务处理场景下配置较小的块大小,数仓场景下配置较大的块大小。 建库指定的块大小不能再被改变,除非重新建库。 |
DATA_BUFFER_SIZE | 数据缓存区的大小,该值对数据库的性能表现至关重要,合理的缓存区配置将有效降低IO的开销。 建议DATA_BUFFER_SIZE的配置参考参数大小。 该参数设置过小可能会出现启动或建库失败,最小值近似公式:(UNDO_SEGMENTS * 99 + 1K)* DB_BLOCK_SIZE,UNDO_SEGMENTS和DB_BLOCK_SIZE参考CREATE DATABASE,计算时UNDO_SEGMENTS最小取64。 |
COMPRESSION | LSC表默认压缩方式,若建表时不指定压缩方式则使用该配置。该值可设置为UNCOMPRESSED不压缩、LZ4压缩或ZSTD压缩。 建议使用压缩,可减少存储空间占用,降低IO开销。在压缩率方面ZSTD优于LZ4;在压缩、解压时间方面LZ4优于ZSTD。 |
CHECKPOINT_TIMEOUT | 检查点时间间隔,表示每过一段时间执行一次增量检查点。 提高检查点频率能减少redo追尾风险,减少宕机重启时间,但是会增加磁盘IO。反之,则会增加redo追尾风险,增加宕机重启时间。 建议该值设置为10到30秒,但如果是持续时间较短的极限性能测试场景,可以设置为较大值,不触发检查点。 |
CHECKPOINT_INTERVAL | 检查点redo大小阈值,表示当检查点覆盖的redo(重启回放所需的redo)的总大小超过该值时,将执行一次增量检查点。 设置较小的阈值可以提高检查点频率和减少redo追尾风险,减少宕机重启时间。 建议该值设置为redo文件的平均大小,但如果是持续时间较短的极限性能测试场景,可以设置为较大值,不触发检查点。 |
# 参数关联性
YashanDB的大部分参数是独立的,但是某些参数之间会有关联性,某些文件的大小也依赖于参数设置。
- REDO_BUFFER_PARTS与参数REDO_BUFFER_SIZE有关联,配置不合理可能会导致数据库启动报错,详细信息请参考配置参数。
- 双写文件的最小大小,依赖于DBWR_COUNT,DBWR_BUFFER_SIZE和DB_BLOCK_SIZE。当这些参数调整变大后,数据库启动可能报双写文件太小的错误,此时需要resize双写文件。
- redo文件的最小大小,依赖于REDO_BUFFER_SIZE,MAX_SESSIONS和DB_BLOCK_SIZE。详细信息请参考ALTER_DATABSE和配置参数。
# 参数大小
资源相关的参数不能设置太大,否则会因为无法申请资源而导致数据库启动失败。内存相关的参数则更需要关注,虽然这些参数设置较大对性能有提升,但系统总内存是有限的,合理分配这些内存才能最大化发挥数据库性能。其中,DATA_BUFFER_SIZE,SCOL_DATA_BUFFER_SIZE,COLUMNAR_VM_BUFFER_SIZE和VM_BUFFER_SIZE所占内存最多,在不同的业务场景下,这些参数的比重也不一样。此处分别给出单机和分布式部署场景下不同表类型的配置建议:
单机部署场景
- 如果表类型都是HEAP,建议DATA_BUFFER_SIZE占80%左右,VM_BUFFER_SIZE根据业务类型分配,SCOL_DATA_BUFFER_SIZE和COLUMNAR_VM_BUFFER_SIZE使用默认值。
- 如果表类型都是TAC,建议DATA_BUFFER_SIZE占60%左右,COLUMNAR_VM_BUFFER_SIZE占30%左右,VM_BUFFER_SIZE适当分配,SCOL_DATA_BUFFER_SIZE使用默认值。
- 如果表类型都是LSC,建议SCOL_DATA_BUFFER_SIZE占50%左右,DATA_BUFFER_SIZE占10%左右,COLUMNAR_VM_BUFFER_SIZE占25%左右,VM_BUFFER_SIZE适当分配。
分布式部署场景
对于CN节点:
- 如果表类型都是HEAP,建议VM_BUFFER_SIZE根据业务类型分配,DATA_BUFFER_SIZE、SCOL_DATA_BUFFER_SIZE和COLUMNAR_VM_BUFFER_SIZE使用默认值。
- 如果表类型都是TAC,建议COLUMNAR_VM_BUFFER_SIZE占70%左右,VM_BUFFER_SIZE适当分配,DATA_BUFFER_SIZE和SCOL_DATA_BUFFER_SIZE使用默认值。
- 如果表类型都是LSC,建议COLUMNAR_VM_BUFFER_SIZE占75%左右,VM_BUFFER_SIZE适当分配,DATA_BUFFER_SIZE和SCOL_DATA_BUFFER_SIZE使用默认值。
对于DN节点:
- 如果表类型都是HEAP,建议DATA_BUFFER_SIZE占90%左右,VM_BUFFER_SIZE根据业务类型分配,SCOL_DATA_BUFFER_SIZE和COLUMNAR_VM_BUFFER_SIZE使用默认值。
- 如果表类型都是TAC,建议DATA_BUFFER_SIZE占50%左右,COLUMNAR_VM_BUFFER_SIZE占35%左右,VM_BUFFER_SIZE适当分配,SCOL_DATA_BUFFER_SIZE使用默认值。
- 如果表类型都是LSC,建议SCOL_DATA_BUFFER_SIZE占50%左右,COLUMNAR_VM_BUFFER_SIZE占35%左右,DATA_BUFFER_SIZE占5%左右,VM_BUFFER_SIZE适当分配。
对于MN节点:建议DATA_BUFFER_SIZE,SCOL_DATA_BUFFER_SIZE,COLUMNAR_VM_BUFFER_SIZE和VM_BUFFER_SIZE都使用默认值。
以上只是建议配置,并不能让所有业务模型都达到性能最优。可参考DBMS_PARAM自适应生成和应用配置推荐参数。
# 初始化redo文件
出于性能考虑,YashanDB基于WAL(Write-ahead logging)机制来保证数据持久化,数据库性能也因此与redo文件的大小息息相关。通常情况下,redo文件越大,数据库整体性能越好。当redo文件较小时,需要频繁触发检查点机制来释放redo空间,会对数据库性能造成冲击。
redo文件是循环复用的,并且旧的redo文件被复用前,该redo对应的脏页必须全部刷盘。如果redo被复用前,对应脏页还没有被Checkpoint刷到磁盘,系统将抛出checkpoint not complete的告警日志,且业务执行会被阻塞,即redo追尾现象。
当业务量激增,redo产生的速度超过Checkpoint的速度时,过一段时间后就会发生redo追尾。通常较大的redo文件能提供更长的追尾缓冲时间。
redo文件不宜过小,否则会造成redo频繁切换。
建议初始创建至少6个redo文件,每个redo文件的大小根据磁盘资源设置,范围在100MB到100GB间,redo块大小设置为系统支持的IO块大小。对redo文件大小设置的经验参考:数据库正常负载下,自动切换redo文件的时间间隔应该至少为5分钟。
# 初始化表空间
YashanDB存在不同用途的表空间,数据库性能与每种类型的表空间都息息相关。对于内置表空间,如果在建库SQL中不额外指定其信息,系统将创建默认大小的内置表空间,该值一般远小于正常的应用需求。所以用户在创建数据库时,应该根据数据量、并发数、应用场景等不同因素为所有内置表空间配置合理的初始大小。
# Permanent类型表空间
Permanent表空间用于存储用户数据。在配置表空间中,SYSTEM和SYSAUX表空间一般被用于存储数据库的元数据,对于用户数据建议单独采用用户表空间进行存储(使用默认USERS表空间,或创建新的用户表空间)。
用户应该对数据存储空间有预先规划,存储空间过小或过大都会带来问题:
- 表空间太小:实际使用的空间大于表空间容量时,可能导致应用报错。通过打开自动扩展可避免报错,但可能导致应用性能的波动。
- 表空间太大:空间浪费严重,有可能导致系统资源耗尽的情况。
在规划数据存储空间时,需要考虑以下几个要素:
- 表空间数量:一般情况下只需要一个表空间即可,但有些场景,例如数据分区,可以选择将数据存储在不同表空间以提升性能和可靠性。
- 表空间挂载的数据文件数量:YashanDB默认单个数据文件的最大大小为512G,当数据量超过该值时,需要考虑增加多个数据文件。
- 数据文件的大小和属性:为了避免运行中的自动扩展,应该尽可能通过初始化值满足应用要求的数据文件大小。在配置自动扩展属性时,应当考虑MAXSIZE在规划的容量范围内,避免出现资源耗尽的情况。
YashanDB在创建数据文件时,采用了空间预占的策略,初始化的时间可能会比较久,建议同时创建多个表空间,以提升初始化效率。
# undo类型表空间
undo类型表空间(即内置表空间中的UNDO表空间)用于存储undo数据,在回滚、一致性读等场景使用。
与用户数据存储不同,undo数据的存储采用循环复用的机制,即超过保留期限(由UNDO_RETENTION参数控制)的undo将有可能被覆盖。这要求用户根据实际场景来配置合理的UNDO表空间大小值,如果配置过小,可能导致出现快照过旧的错误;如果配置过大,可能会造成UNDO表空间的空间浪费。
建议结合UNDO_RETENTION参数值进行UNDO表空间的初始化配置:
- 一般情况下, UNDO_RETENTION越大,UNDO表空间的规划就应该越大。
- UNDO表空间的初始值可以相对小一些(例如1G),并对其配置合理的扩展属性。
- 通过参数UNDO_SHRINK_ENABLED和UNDO_SHRINK_INTERVAL打开undo的自维护机制,降低维护UNDO表空间的难度。
# Temporary类型表空间
Temporary类型表空间用于必要时持久化临时表数据,对其初始大小的配置取决于应用系统中临时表可能被使用的情况。建议初始值不要配置过大,打开自动扩展即可,除非应用系统有明确的临时表需求。
YashanDB中,临时表的存储空间采用预占方式,但只有在BUFFER不足需要换出时才会被使用,且在数据库重启之后被重置。因此用户可以考虑如下两方面的调优:
- Temporary表空间的空间不足时,通过RESIZE或ADD DATAFILE的方式增加容量。
- Temporary表空间的空间过剩时,对其执行SHRINK以释放物理空间。
# Swap类型表空间
Swap类型表空间被用作VM BUFFER的物理交换空间。在SORT、GROUP BY、HASH JOIN等场景中VM BUFFER将被消耗,当VM BUFFER不足时,需要通过Swap表空间进行换入换出。
用户应该结合VM_BUFFER_SIZE参数值和自身业务状况对Swap表空间大小配置合适的初始值。当无法准确评估时,可以先初始化为一个较小的值,并打开自动扩展。
Swap表空间可能因为某些SQL临时性地被撑大,发现此种情况时,用户可以在空间空闲后通过SHRINK功能释放物理空间。