#术语表

首字母索引: A B C D F G H I J K L M N O P R S T U V W X Y Z 2

# AAP

Adaptive Asynchronous Parallel

自适应异步并行策略:YashanDB在分布式部署中所采用的通信策略。

# AC

Access Constraint

访问约束:基于有界计算理论,由YashanDB独创的一种数据库对象,通过访问AC的有界等价替换实现了规模无关查询,对海量数据分析时的查询效率量级加速。

# ACID

Atomicity、Consistency、Isolation、Durability

原子性、一致性、隔离性、持久性:一个可靠的数据库系统中,事务应该具有的四个特性,业界标准的ACID概念。

# Ad-hoc

Ad hoc queries

即席查询:由用户灵活定义查询条件,系统根据条件自动生成统计报表。

# AES

Advanced Encryption Standard

高级加密标准:一种最流行的对称加密算法,加密和解密使用相同的密码。其中AES128、AES192、AES256分别表示其密钥按128位、192位、256位进行分组。

# ASCII

American Standard Code for Information Interchang

美国标准信息交换代码:YashanDB支持的一种字符集,该字符集是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准ISO/IEC 646。

# ASN

Archive Sequence Number

归档序列号:归档文件序列号,每次切换redo文件,序列号加一。

# AU

Allocation Units

分配单元:YashanDB的YFS进行磁盘空间分配的最小单位。

# BTREE存储结构

Balanced Tree

B树(平衡的多叉树)存储结构:一种常见的自平衡树数据结构,用于组织和存储有序数据,数据写入时按照Key值进行有序写入,以提高查询效率。

# BTree索引

B树索引:一种基于B树数据结构的索引,用于在数据库系统中加速对数据的检索操作。BTree索引是YashanDB数据库默认的索引类型。

# CBO

Cost-Based Optimizer

基于代价的优化器:优化器是数据库中用于负责生成SQL执行计划的一个核心组件,CBO则表示优化器基于查询的代价来决策最优的执行计划。

# CDC

Change Data Capture

数据变更捕获:一种用于捕获数据库变更的技术。通过CDC技术,用户可以监视和捕获数据库中的更改操作,例如插入、更新和删除操作,然后将这些变更记录下来以供进一步处理或分析。

# CGROUP

Control Groups

资源控制组:Linux内核提供的一种机制,将一系列的任务及其子任务进行集合(或划分)到不同的分组内,并以此分配所需的资源。

# CMS

Cluster Management Service

分布式集群管理服务:YashanDB在分布式部署中提供的一种分布式集群管理服务。

# CN

Coordinator Node

协调节点:YashanDB在分布式部署中,CN采用多活架构,负责对外提供接口,接收用户请求,生成分布式查询计划,向DN分发查询计划并汇总执行结果。

# CTE

Common Table Expression

公用表表达式:在SQL语句中可以被多处引用的子查询,将其称为CTE。例如SELECT语句中在WITH后定义的子查询就是CTE,其可以在后面的语句中被多次引用,且可用于创建递归查询。

# DC

Dictionary Cache

数据字典缓存:YashanDB里的一个缓存区域,用于存储数据库数据和对象的元信息,使用数据字典缓存可以对数据访问进行加速。

# DDL

Data Definition Language

数据定义语言:在ANSI SQL标准中,将SQL划分为DDL、DML、DCL等类型,其中DDL类的SQL语句用于操作数据库中的对象和对象属性。

# DERM

Distribute Execute Resource Manager

分布式执行资源管理:YashanDB在分布式部署中用于执行资源管理的模块。

# DG

DiskGroup

磁盘组:YashanDB的YFS进行磁盘设备管理的逻辑单位。

# DH

Diffie-Hellman

密钥交换协议:DH用于保证通信双方安全地交换密钥,在SSL连接中要求使用此协议。

# DIN

Distribute Internal Network

分布式内部网络:YashanDB在分布式部署中跨节点访问使用的内部网络。

# DML

Data Manipulation Language

数据操控语言:在ANSI SQL标准中,将SQL划分为DDL、DML、DCL等类型,其中DML类的SQL语句用于操作数据库中对象包含的数据,即记录。

# DN

Data Node

数据节点:YashanDB在分布式部署中,DN负责存储数据,执行CN下发的查询计划。通过DN组提供高可用能力,组内节点具有主从关系,通过Raft协议实现节点间的数据一致性。

# DXG

Data Exchange

网络数据交换算子:YashanDB在分布式部署中,在执行过程中对数据在分布式集群中间进行重新组织和计算的能力。

# FG

FailureGroup

故障组:YanshanDB的YFS实现磁盘数据高可用的逻辑单位。

# GBK

Chinese Internal Code Specification

汉字内码扩展规范:YashanDB支持的一种字符集,该字符集采用单双字节变长编码,英文使用单字节编码,完全兼容ASCII字符编码,中文部分采用双字节编码。

# GCS

Global Cache Service

全局缓存服务:YashanDB共享集群中,全局缓存服务实现数据块在实例之间的共享。

# GLS

Global Lock Service

全局锁服务:YashanDB共享集群中,全局锁服务负责实例之间的并发控制。

# GRC

Global Resource Catalog

全局资源目录:YashanDB共享集群中,全局资源目录登记了所有数据块以及锁资源的状态信息。

# GTID

Global Transaction ID

全局事务号:用于标识全局唯一的分布式事务。

# GTS

Global Time Service

全局时间服务:YashanDB在分布式部署中的全局时间管理服务。

# HA

High Availability

高可用性:指系统无中断地执行其功能的能力。YashanDB的主备复制架构即为一种高可用性能力。

# HTAP

Hybrid Transaction and Analytical Process

混合事务和分析处理:一种新的数据库形态,打破OLTP与OLAP之间的隔阂,满足了在同一个数据库中既支持事务性业务场景,又支持分析性业务场景的需求。

# HWM

High Water Mark

高水位线:在数据库中,高水位线用于标记某块内存区域被使用的最上线,例如一个Segment中已存放数据的最上线。

# ICS

Interconnect Communication Service

内部通讯服务:YashanDB共享集群中,为实例之间提供内部通讯的服务。

# ISO-8859-1

ISO-8859-1(Latin1)

ISO-8859-1(Latin1):YashanDB支持的一种字符集,该字符集是单字节编码,向下兼容ASCII。

# JDBC

Java Database Connectivity

Java数据库连接:Java语言中定义的操作数据库和执行SQL语句的规范、规则的接口。YashanDB JDBC是YashanDB提供的JDBC驱动,用户可以使用该驱动来连接数据库,并操作数据库和执行SQL语句。

# JSON

JavaScript Object Notation

JavaScript对象标记法:JSON是一种轻量级的数据交换格式,通过JavaScript对象标记法书写的文本。

# 柯里化

Currying

柯里化:一种函数式编程的技术,‌它将接受多个参数的函数转换为接受单个参数的函数,‌并返回一个新的函数,‌这个新函数接受剩余的参数并返回结果。

# LBAC

Label-Based Access Control

基于标签的访问控制:根据用户的安全标签以及数据的安全标签来控制数据访问,精准控制用户对表中各行数据的读写权限。

# LCR

Log Change Record

日志变更记录:通常用于描述数据库事务日志中的变更记录,记录了对数据库中数据的修改操作,包括插入、更新和删除等。LCR可以用于异构数据库复制和日志分析等。

# LFN

Log Flush Number

日志刷盘序号:数据库中全局递增的表示redo刷盘次数的编号,每执行一次redo刷盘,该编号加一。

# LOB

Large Object

大对象:YashanDB支持的一种数据类型,其中BLOB为二进制大对象,CLOB为文本大对象。

# LRU

Least Recently Used

最近最少使用:YashanDB中使用的一种内存淘汰算法。

# LSC

Large-scale Storage Columnar Table

列存表:YashanDB中存储海量数据的表类型,提供低成本的海量数据管理方案,支持数据的实时存储分析以及海量数据的更新。

# LZ4

一种比较通用的、以高效著称的压缩算法。

# MCOL

Mutable Columnar Storage

可变的列式存储:YashanDB中一种存储结构,被应用于TAC和LSC表中。

# MDS

MetaData Service

元数据服务:YashanDB在分布式部署中提供的一种元数据管理服务。

# MMS

Memory Mapped Space

内存映射表空间:YashanDB中一种特殊的表空间,用于内存数据库中。和普通表空间相比,MMS的datafile对应的block常驻在内存页。MMS在数据库启动时支持采用预加载的方式,即将该表空间数据全部加载到内存中。

# MN

Management Node

管理节点:YashanDB在分布式部署中,MN负责分布式集群的节点管理服务、元数据管理服务和分布式事务服务。MN组内节点具有主从关系,通过Raft协议实现节点间的一致性。

# MVCC

Multi-Version Concurrency Control

多版本并发控制:一种并发控制的方法,在数据库中表示对数据库的并发访问,它实现的是不同事务的读-写、写-读操作可以在数据一致性的前提下并发执行。YashanDB也是一种基于MVCC实现并发事务能力的数据库。

# NUMA

Non-Uniform Memory Access

非统一内存访问:一种操作系统架构,非统一内存访问技术,通过提供分离的存储器给各个处理器来提高存储访问性能。

# OLAP

Online Analytical Processing

联机分析处理:一种面向数据分析的数据库形态,支持对海量数据的各种复杂分析操作,用于决策支持,例如数据仓库。

# OLTP

Online Transactional Processing

联机事务处理:一种面向交易处理的数据库形态,需要在很短的时间内给出用户请求的处理结果。

# PITR

Point-In-Time Recovery

基于时间点数据库恢复,使用备份集和归档日志恢复到备份时间点之后的任意一个时间点,从而用来回退数据库操作,解决误操作导致数据损害等问题。

# PL

Procedural Language

过程化SQL语言:建立在普通SQL语言之上的一种过程化的编程语言。

# PX

Parallel Execution

并行执行算子:YashanDB在分布式执行中,对数据在分布式集群中间进行重新组织和计算的能力。并行环境中,对数据在多线程间进行重新组织和计算的能力。

# RBO

Rule-Based Optimizer

基于规则的优化器:优化器是数据库中用于负责生成SQL执行计划的一个核心组件,RBO则表示优化器按照指定的规则顺序来决策最优的执行计划。

# RLE

Run-Length Code

游程长度编码:一种数据编码方式,在数据写入时, 将相同数值的连续串用值和长度来替代 ,从而实现数据的压缩存储。

# RPC

Remote Procedure Call Protocol

远程过程调用协议:YashanDB的一些内部组件间通信所采用的协议。

# S3

Amazon Simple Storage Service

亚马逊简易存储服务:亚马逊公司利用其亚马逊网络服务系统所提供的网络在线存储服务。

# SCN

System Change Number

系统变更号:数据库中的一个单一的不断的随着数据库一致性状态的改变而自增的序列,数据库的逻辑时间戳。YashanDB为每个已提交的事务分配一个唯一的SCN。

# SCOL

Stable Columnar Storage

稳定的列式存储:YashanDB中的一种存储结构,被应用于LSC表中。

# SCSI

Small Computer System Interface

小型计算机系统接口:一种基于SCSI标准协议的存储技术。

# SIMD

Single Instruction Multiple Data

单指令多数据:在同一时间内一次对批量的数据执行同一条指令,并行计算以提高效率。

# SM4

由国家密码局发布的、可用于替代DES/AES等国际算法的对称加密算法,加密与解密使用相同的密码,密钥按128位分组。

# SQL

Structured Query Language

结构化查询语言:一种ANSI的标准计算机语言,用来访问和操作数据库系统。

# SSL

Secure Socket Layer

安全套接层协议:在客户端与服务器之间进行加密通讯的全球化标准协议。

# SSM

Segment Space Management

段空间管理:在段页式存储模式中使用的一种段空间管理手段。

# TAC

Transaction Analytics Columnar Table

列存表:YashanDB中主打实时分析场景的一种表类型,用于提供HTAP能力。

# TAF

Transparent Application Failover

透明故障转移:是一项客户端功能,用于驱动因发生故障断连时自动重连数据库,旨在最大程度地减少数据库连接因实例或网络故障而失败时对最终用户应用程序的中断。

# TDE

Transparent Data Encryption

透明数据加密:透明加密技术能够对存储介质上的数据进行加密,但对于数据库内部访问是完全透明的,既能保证数据安全,又完全不影响数据库功能和用户使用。

# TM

Transaction Manager

分布式事务管理:XA协议中定义的事务管理器,在分布式事务中负责整体的协调。

# TPC

Transaction ProcessingPerformance Council

事务处理性能委员会:一个非盈利性组织,其定义了如TPC-C、TPC-H和TPC-DS等的基准测试项目,并依据这些基准测试项目发布客观性能数据。

# TPC-C

TPC-C

衡量联机事务处理(OLTP)系统性能的行业标准基准测试项目。

# TPC-H

TPC-H

衡量联机分析处理(OLAP)系统性能的行业标准基准测试项目。

# TPC-DS

TPC-DS

TPC组织推出的用于替代TPC-H的下一代决策支持系统测试基准。

# UDF

User-Defined Function

用户自定义函数:由用户自行编程来创建的函数,它是数据库的一种过程化对象。

# UDS/IPC

UNIX Domain Socket/Inter-Process Communication Socket

同一服务器的进程间通信机制:与服务器间的进程通信采用"IP地址+端口号"的方式不同,UDS使用文件系统来完成进程间的通信。

# UTF-8

8-bit Unicode Transformation Format

针对Unicode的可变长度字符编码,万国码:YashanDB支持的一种字符集,该字符集使用1、2、3字节等对Unicode进行编码,因可以兼容ASCII而被广泛使用。

# VM

Virtual Memory

虚拟内存:SQL执行过程中,物化、排序等需求内存比较大的场景所使用的内存区。

# WAL

Write Ahead Logging

预写式日志:YashanDB里实现数据持久化的一种机制,这种机制里,对数据的修改并不会直接写磁盘,而是记入重做日志中,事务提交时才执行将日志写入磁盘操作。

# XA

eXtended Architecture

分布式事务:XA为一种分布式交易处理的规范,在YashanDB中使用XA事务表示分布式事务。

# XRM

Transaction resource manager

事务资源管理器:YashanDB里用于管理事务处理的资源。

# YCK

Yashan Cluster Kernel

崖山集群内核:YashanDB共享集群的内核组件,聚合多实例对数据资源和非数据资源的并发访问。

# YCS

Yashan Cluster Service

崖山集群服务:YashanDB共享集群中,集群服务负责共享集群数据库实例以及文件系统资源。

# YCR

Yashan Cluster Register

集群配置表:YashanDB共享集群中,集群配置表负责保存集群服务的配置信息,包括服务器配置、资源配置等。

# YEX

YashanDB external agent

用于执行外置UDF的代理程序。

# YFS

Yashan File System

崖山文件系统:YashanDB共享集群中,文件系统负责管理存储设备,并提供类文件系统接口给数据库使用。

# ZSTD

Zstandard

一种快速无损压缩算法,该算法能同时做到高压缩比以及高压缩性能。

# 2PC

Two-phase Commit

二阶段提交:当一个事务跨越多个节点时,为了保持事务的ACID特性,需要引入一个作为协调者的组件来统一掌控所有节点(称作参与者)的操作结果并最终指示这些节点是否要把操作结果进行真正的提交。