#CREATE TABLE

# 通用描述

CREATE TABLE语句用于创建一个表对象。

创建表时，可以使用关键字COLLATE为表或表中的列字段指定字符集排序属性，具备字符集排序属性的列称为字符集排序列。

如果创建数据库时未显式指定库的字符序，则库的字符序采用collation_server参数的值。
如果创建数据表时未显式指定表的字符序，则该表使用所在数据库的字符序。
如果创建数据表时未显式指定列字段的字符序，则该字段使用所在表的字符序。

# 语句定义

create table::=

语法图

代码

syntax

relation_properties::=

语法图

代码

syntax

column_definition::=

语法图

代码

syntax

syntax::= column dataType [(CHARACTER SET charset_name | COLLATE collation_name | COMMENT "string" | DEFAULT default_expr | inline_constraint | AUTO_INCREMENT) 
{" " (CHARACTER SET charset_name | COLLATE collation_name | COMMENT "string" | DEFAULT default_expr | inline_constraint)}]

index_definition::=

语法图

代码

syntax

syntax::= (INDEX | KEY) [index_name] [USING (BTREE | HASH)] "(" column_name { "," column_name}")" [KEY_BLOCK_SIZE ["="] value] 

syntax::= (INDEX | KEY) [index_name] [KEY_BLOCK_SIZE ["="] value] "(" column_name { "," column_name}")" [USING (BTREE | HASH)]

table_options::=

语法图

代码

syntax

syntax::=(ENGINE "=" engine_name  | [DEFAULT] CHARACTER SET ["="] charset_name | [DEFAULT] COLLATE ["="] collation_name| ROW_FORMAT ["="] {DEFAULT | DYNAMIC | FIXED | COMPRESSED | REDUNDANT | COMPACT} | AUTO_INCREMENT ["="] increment_start_value | (MAX_ROWS ["="] max_rows) | (MIN_ROWS ["="] min_rows))

partition_options::=

语法图

代码

syntax

syntax::= (range_partitions
|list_partitions
|hash_partitions
|range_columns_partitions
|list_columns_partitions
|linear_hash_partitions
|linear_key_partitions
|composite_range_partitions
|composite_list_partitions)

range_partitions::=

语法图

代码

syntax

syntax::= PARTITION BY RANGE [COLUMNS] "(" ((column) {"," (column)}) ")" 
"(" (PARTITION [partname]  range_values_clause  [partition_storage_clause])
{"," (PARTITION [partname]  range_values_clause  [partition_storage_clause])} ")"

range_values_clause::=

语法图

代码

syntax

partition_storage_clause::=

表分区存储属性语法与表存储属性table_options语法一致。

list_partitions::=

语法图

代码

syntax

syntax::= PARTITION BY [COLUMNS] LIST "(" (column) {"," (column)} ")" "(" (PARTITION [partname] 
list_values_clause  [partition_storage_clause])
{"," (PARTITION [partname]  list_values_clause  [partition_storage_clause])} ")"

list_values_clause::=

语法图

代码

syntax

list_values::=

语法图

代码

syntax

hash_partitions::=

语法图

代码

syntax

individual_partition_clause::=

语法图

代码

syntax

hash_partitions_by_quantity::=

语法图

代码

syntax

linear_key_partitions::=

语法图

代码

syntax

composite_range_partitions::=

语法图

代码

syntax

subpartition_by_hash::=

语法图

代码

syntax

hash_subparts_by_quantity::=

语法图

代码

syntax

subpartition_storage_clause::=

组合分区的子分区存储属性语法与表存储属性table_options语法一致。

subpartition_by_key::=

语法图

代码

syntax

composite_list_partitions::=

语法图

代码

syntax

# relation_properties

该语句用于指定创建的表的结构，包括列字段（Column）和约束（Constraint）。

# column_definition

该语句用于定义表的列字段，包括数据类型DataType、缺省值DEFAULT、行内约束inline_constraint等列定义以及CHARACTER SET、COLLATE、COMMENT、AUTO_INCREMENT等列属性。

字符集和字符序

CHARACTER SET	COLLATE	DEFAULT COLLATION
ASCII	ASCII_BIN ASCII_GENERAL_CI ASCII_TOLOWER_CI	ASCII_GENERAL_CI
GBK	GBK_BIN GBK_GENERAL_CI GBK_TOLOWER_CI	GBK_GENERAL_CI
UTF8	UTF8_BIN UTF8_GENERAL_CI UTF8_TOLOWER_CI	UTF8_GENERAL_CI
LATIN1	ISO88591_BIN ISO88591_TOLOWER_CI ISO88591_GENERAL_CI	ISO88591_GENERAL_CI
GB18030	GB18030_BIN GB18030_TOLOWER_CI GB18030_GENERAL_CI	GB18030_GENERAL_CI
UTF8MB4	UTF8_BIN UTF8_GENERAL_CI	UTF8_GENERAL_CI
UTF8MB3	UTF8_BIN UTF8_GENERAL_CI	UTF8_GENERAL_CI
UTF16	UTF16_GENERAL_CS UTF16_GENERAL_CI	UTF16_GENERAL_CI

自增列

自增列可用于为新的记录生成唯一标识。一个表只能有一个自增列，自增列必须为索引列或组合列索引中的第一列。自增列的自增满足以下规则：

自增列必须为数值类型，支持INT、DOUBLE和FLOAT类型列配置自增列。
不对自增字段赋值，数据库会自动将自增值（默认从1开始）填入字段中，AUTO_INCREMENT自增。
对自增字段赋0或null值，数据库会自动将自增值填入字段中，AUTO_INCREMENT自增。
直接使用大于AUTO_INCREMENT的值X，数据库会将X填入字段并修改AUTO_INCREMENT = X + 1。
使用小于AUTO_INCREMENT但不冲突的值时，数据可以插入，但AUTO_INCREMENT不变。
自增步长固定为1。
暂不支持把非自增列改成自增列。
如果需要重新设置自增列的起始值可以通过alter table语句。
自增列不能配置缺省值DEFAULT。

# index_definition

该语句用于定义索引。

支持使用BTree索引，HASH索引完成语法兼容。
KEY_BLOCK_SIZE，仅完成语法兼容。

# table_options

该语句用于定义表的选项，表选项包括ENGINE、AUTO_INCREMENT、CHARACTER SET、COLLATE以及ROW_FORMAT等。

目前已完成TABLESPACE、CHARACTER SET、COLLATE、AUTO_INCREMENT的功能配置，其他配置项仅为语法兼容。

示例（HEAP表）

-- 选择数据库
USE sales;

-- 表选项
CREATE TABLE finance_info(
    id INT auto_increment PRIMARY key,
    name VARCHAR(100) NOT null
) engine = InnoDB CHARACTER SET utf8mb4 collate utf8mb4_bin row_format = DEFAULT AUTO_INCREMENT=100;

-- 列属性
CREATE TABLE employee_info(
    id INT auto_increment PRIMARY key COMMENT 'primary key',
    name VARCHAR(100) NOT null CHARACTER SET utf8mb4 collate utf8mb4_bin
);

--带索引
CREATE TABLE branches(
    ind INT,
    name VARCHAR(10),
    key(ind)
);

# partition_options

该语句用于为表创建分区（Partition）或组合分区，可通过INFORMATION_SCHEMA.PARTITIONS视图查看所有分区和子分区信息。

在mysql模式下，创建组合分区时，一级分区支持RANGE和LIST的分区，此时子分区的类型支持为HASH和KEY。

mysql模式下，如果创建一级分区为HASH分区的组合分区，则按照yashan模式进行语法解析和执行，数据库依然可以正常提供服务。

# range_partitions

创建范围分区，分区列为多项时以,分隔。

# range_values_clause

定义范围分区的上限值。

# partition_storage_clause

分区的存储属性。包括为分区指定一个表空间，省略则默认为表所在的表空间。

表分区、组合分区的子分区存储属性配置语法与表存储属性一致。

示例（HEAP表）

CREATE TABLE orders_info1 (
    id INT,
    num INT
)
PARTITION BY RANGE (id)  (
    PARTITION p0 VALUES LESS THAN (5),
    PARTITION p1 VALUES LESS THAN (MAXVALUE)
);

-- 创建分区表，为表和分区都指定storage属性
CREATE TABLE part_storage(a INT, b CHAR(255)) ENGINE=InnoDB
PARTITION BY RANGE(a, b)
(
	PARTITION p1 VALUES LESS THAN(1, 'a') STORAGE ENGINE=InnoDB,
	PARTITION p2 VALUES LESS THAN(10, 'c') STORAGE ENGINE=InnoDB,
	PARTITION p3 VALUES LESS THAN(MAXVALUE, MAXVALUE) STORAGE ENGINE=InnoDB
); 

-- 创建索引，为索引指定storage属性
CREATE INDEX idx_part_storage_2 
ON part_storage(b) 
STORAGE (MINEXTENTS 1 MAXEXTENTS 10 PCTINCREASE 0);

# list_partitions

创建列表分区，分区列为多项时以,分隔。

# list_values_clause

定义列表分区的列表内容。

list_values

分区列为多项时，须用,分隔并与分区列一一对应，该列表内容须指定为字面量或NULL。

示例（HEAP表）

CREATE TABLE employees (
    id INT NOT NULL,
    fname VARCHAR(30),
    lname VARCHAR(30),
    hired DATE NOT NULL DEFAULT '1970-01-01',
    separated DATE NOT NULL DEFAULT '9999-12-31',
    job_code INT,
    store_id INT
)
PARTITION BY LIST(store_id) (
    PARTITION pNorth VALUES IN (3,5,6,9,17),
    PARTITION pEast VALUES IN (1,2,10,11,19,20),
    PARTITION pWest VALUES IN (4,12,13,14,18),
    PARTITION pCentral VALUES IN (7,8,15,16)
);

# hash_partitions

创建哈希分区，分区列为多项时以,分隔，哈希分区有如下两种创建方式：

逐个指定哈希分区。
使用hash分数批量指定哈希分区。

# individual_partition_clause

本语句用于逐个指定哈希分区，对每个分区分别定义其名称和存储属性，分区之间用,分隔。

# hash_partitions_by_quantity

本语句用于按hash分数批量指定哈希分区，所有分区名称由系统生成。

hash_partition_quantity

表示hash分区的数量。

STORE IN

STORE IN子句描述哈希分区所属的表空间，表空间可指定多个，且数量不需要与分区的数量一致，系统将按本语句中表空间指定的顺序进行循环归属。

不指定本语句时，系统默认使用表所在的表空间作为所有分区的表空间。

示例（HEAP表）

CREATE TABLE sales_info (
    id INT NOT NULL,
    fname VARCHAR(30),
    lname VARCHAR(30),
    hired DATE NOT NULL DEFAULT '1970-01-01',
    separated DATE NOT NULL DEFAULT '9999-12-31',
    job_code INT,
    store_id INT
)
PARTITION BY HASH(store_id)
PARTITIONS 4;

CREATE TABLE subpart_hash(c1 INT, c2 INT)
  PARTITION BY HASH(c1)
  SUBPARTITION BY HASH(c1)
  SUBPARTITIONS 2
  STORE IN (users)
  (PARTITION p1, PARTITION p2);

# range_columns_partitions

基于一个或多个列的取值范围进行分区，分区依据是这些列的值组成的元组。

示例（HEAP表）

CREATE TABLE sales_info_range (
    quantity INT,
    amount INT
)
PARTITION BY RANGE COLUMNS(quantity, amount) (
    PARTITION p0 VALUES LESS THAN (5, 12),
    PARTITION p3 VALUES LESS THAN (MAXVALUE, MAXVALUE)
);

# list_columns_partitions

基于一个或多个列的取值列表进行分区，分区依据是这些列的值组成的元组。

示例（HEAP表）

CREATE TABLE city_info (
    first_name VARCHAR(25),
    last_name VARCHAR(25),
    street_1 VARCHAR(30),
    street_2 VARCHAR(30),
    city VARCHAR(15),
    renewal DATE
)
PARTITION BY LIST COLUMNS(city) (
    PARTITION pRegion_1 VALUES IN('Oskarshamn', 'Högsby', 'Mönsterås'),
    PARTITION pRegion_2 VALUES IN('Vimmerby', 'Hultsfred', 'Västervik'),
    PARTITION pRegion_3 VALUES IN('Nässjö', 'Eksjö', 'Vetlanda'),
    PARTITION pRegion_4 VALUES IN('Uppvidinge', 'Alvesta', 'Växjo')
);

# linear_hash_partitions

基于线性对数算法来确定分区，适用于需要快速分区管理和数据分布相对均匀的场景。

示例（HEAP表）

CREATE TABLE sales_info_hash (
    id INT, 
    name CHAR(5), 
    saltime DATE
)
PARTITION BY LINEAR HASH(saltime)
PARTITIONS 6;

# linear_key_partitions

基于线性对数算法来确定分区，适用于需要快速分区管理的场景。

示例（HEAP表）

CREATE TABLE sales_info_hash1 (
    id INT NOT NULL,
    name CHAR(5),
    altime DATE
)
PARTITION BY LINEAR KEY (id)
PARTITIONS 3;

# composite_range_partitions

定义范围分区的组合分区，每个范围分区下可以定义hash或key子分区。

# subpartition_by_hash

定义哈希子分区的分区列，也可以指定子分区的数量。

# hash_subparts_by_quantity

使用hash分数批量定义哈希子分区。

# subpartition_by_key

定义哈希子分区的分区列，也可以指定子分区的数量。

algorithm

用于指定哈希算法，目前仅用于兼容，无实际含义。

示例（HEAP表）

CREATE TABLE employees1 (
id INT NOT NULL,
fname VARCHAR(30),
lname VARCHAR(30)
)
PARTITION BY RANGE (id)
SUBPARTITION BY KEY algorithm = 1 (lname)
SUBPARTITIONS 4 (
PARTITION p0 VALUES LESS THAN (25),
PARTITION p1 VALUES LESS THAN (50),
PARTITION p2 VALUES LESS THAN (100),
PARTITION p3 VALUES LESS THAN (MAXVALUE)
);

# composite_list_partitions

定义列表分区的组合分区，每个列表分区下可以定义hash或key子分区。