#字符集配置
YashanDB服务端和客户端支持GBK、UTF8、GB18030、ASCII和ISO88591字符集,并支持根据场景需要配置数据库字符集。
# 背景信息
默认安装下,YashanDB服务端、Linux客户端、JDBC客户端等均为UTF8字符集,Windows客户端字符集为GBK。
当服务端和客户端设置的字符集不同时,数据库操作产生的最终结果可能会与预期不一致,此时在客户端输入的字符串会以服务端字符集格式进行处理。
YashanDB中国家字符集仅支持为UTF16,建库时指定,后续无法更改。
# 字符集配置原则
字符集 | 配置原则 |
---|---|
GBK | 如数据库只需要支持中文,数据量很大,性能要求也很高,建议选择双字节定长编码的中文字符集GBK。 |
UTF8 | 如应用程序需要处理各种各样的文字,或者需要将处理结果发布到不同语言的国家或地区,建议选择Unicode字符集,即UTF8。此项为YashanDB推荐和默认的字符集。 |
ASCII | 如数据库只需要支持ASCII收录的拉丁系字符,如英语和一些西欧语言,则可以选择ASCII字符集。 |
ISO88591 | 此字符集为单字节编码,能表示的字符范围是0-255,仅应用于全英文场景。 |
GB18030 | 此字符集达到GB18030-2022标准的实现级别三。如果数据库有大量使用中文的场景,且对生僻字的显示、处理、输出有比较严格的要求,可以选择此字符集。 |
Note:
YashanDB的GB18030字符集不支持ASCII范围以外的字符进行大小写的转换。
# 配置方法
# 设置服务端字符集
服务端字符集的限制如下:
若数据库已创建,不允许再修改其字符集配置。
如需使用TAC表或LSC表,数据库服务端的字符集必须设置为UTF8。
服务端字符集设置方法:
初始数据库:在安装部署过程中,可通过设置yashandb.toml配置文件中的建库参数CHARACTER_SET指定初始数据库的字符集。
非初始数据库:在安装完成后,如需删除初始数据库并自定义新建数据库,可以通过CREATE DATABASE语句中的CHARACTER SET字段指定新数据库的字符集。
CREATE DATABASE yashan CHARACTER SET utf8;
# 修改客户端字符集
在YashanDB客户端文件夹中新建client文件夹,并于client文件夹中新建空文件yasc_env.ini。
$ mkdir client $ cd client $ vi yasc_env.ini
设置环境变量。
$ vi ~/.bashrc export YASDB_HOME=/home/yasdb/yashandb_client $ source ~/.bashrc
Note:
YASDB_HOME路径需要指向YashanDB客户端文件夹。
通过修改客户端环境变量文件yasc_env.ini设置客户端字符集。
$ cd $YASDB_HOME/client $ vi yasc_env.ini # 添加如下信息,本文以GBK为例,实际配置时可按需配置为GBK、ASCII或ISO88591 CHARACTER_SET=GBK