#yasboot load

# load

本命令用于拆分大的csv文件,并将拆分后的小文件导入YashanDB的物理表中。文件拆分和导入是通过调用yasldr完成。

选项 含义
-c, --cluster YashanDB的集群名(必传参数)
-b, --batch-size 每批次的CSV数据行数,范围[1,65535]
-m, --mode 导入模式,包括BASIC和BATCH模式
-sm, --split-mode 拆分模式,包括PART、NODE和NODEPART模式,默认PART模式
-f, --control-file control_file文件路径
-j,--part-job 导入分区数据到节点时并行启动的yasldr数量
-n,--no-load 是否只拆分不导入,默认为false
-s,--split-file-directory 已拆分文件路径,表示将已拆分好的数据导入数据库,前提是已经完成了文件拆分命令
-u,--username 集群用户名
-p,--password 集群用户名对应的密码
-tl,--to-local 是否将拆分好的文件打包到节点机器,进行本地导入,默认为false
--param 透传给yasldr的命令行参数
--gz 是否压缩打包文件,默认为false
--delete 删除拆分文件存放目录中的csv文件
--host-id csv文件所在的主机id,可以通过yasboot cluster status命令查询,默认是当前主机
-w, --nowait 运行后不等待执行命令结果
-d, --child 展示任务以及子任务信息
--disable 屏蔽任务进度条展示

Note:

  • 指定的control_fileOPTIONS中必须包含run_level=SPLIT或者run_level=SPLIT_to_part
  • 拆分文件存放目录是通过control_file中的directory_clause指定,不指定的时候默认以infile的第一个文件所在的目录作为输出目录。directory_clause语句详细说明请参考yasldr
  • 导入分布式复制表必须使用PART拆分模式,否则将报错拆分失败。

# 拆分模式

yasboot load命令支持以下三种拆分模式:

拆分模式 说明
PART 拆分成分区数据:
* 分布式:连接DN主节点拆分成分区数据;将分区数据通过连接CN节点导入。
* 单机:拆分和导入都是连接主节点。
NODE 拆分成节点数据,仅支持分布式:
* 分布式:连接CN节点拆分成节点数据;连接DN主节点,将节点数据导入各自节点。
NODEPART 拆分成节点分区数据,仅支持分布式:
* 分布式:连接CN节点拆分成节点分区数据;连接DN主节点,将节点分区数据导入各自节点。

示例

# 一键拆分和导入csv数据(没有指定--host-id参数,默认csv文件在当前主机上)
$ yasboot load -c yashandb -f /var/database/yashan/load/yashanload.ctl -sm PART --param "BATCH_SIZE=2048 CONN_POOL_SIZE=10"

# 一键拆分和导入主机host0002上的csv数据
$ yasboot load -c yashandb -f /var/database/yashan/load/yashanload.ctl -sm NODEPART --host-id host0002

# 一键拆分,打包传输到节点机器,进行本地导入csv数据
$ yasboot load -c yashandb -f /var/database/yashan/load/yashanload.ctl -sm NODEPART -tl

# 一键拆分csv文件
$ yasboot load -c yashandb -f /var/database/yashan/load/yashanload.ctl -sm NODEPART -n

# 一键拆分csv文件,并打包传输到节点机器
$ yasboot load -c yashandb -f /var/database/yashan/load/yashanload.ctl -sm NODEPART -n -tl

# 一键导入已拆分好的csv数据(前提:已完成了一键拆分csv文件命令)
$ yasboot load -c yashandb -s /var/database/yashan/load/splitFileDirectory
下载文档
复制链接