#产品简介
# 数据库管理系统发展简史
数据库管理系统(Database Management System,DBMS)是一种基础软件,用于对数据进行统一、可靠、高效地管理和组织,保证数据地安全性和完整性,同时提供高效的数据查询能力。
数据库 (Database)是指按照数据结构来组织、存储和管理数据的集合。
Note:
数据库(Database)也经常被用来代指数据库管理系统(DBMS),仅在两者同时出现时作概念区分。在本手册中,可能存在代指现象。
初代数据库管理系统主要是层次型和网络型,在层次型数据库中数据按照树状结构组织(与文件系统类似),而在网络型数据库中数据被组织成多对多的网络结构。
1970年E.F.Codd首次提出关系模型,为数据库系统提供了一种统一的、简洁的数据模型。数据组织方式符合关系模型的数据库称为关系数据库,数据储存在由行(数据组成的元组)和列(属性)构成的关系表中。与之对应的DBMS则称为关系数据库管理系统(Relational Database Management System,RDBMS),关系数据库管理系统仍为目前最主流的数据库管理系统。
# YashanDB发展简史
崖山数据库系统YashanDB是深圳计算科学研究院自主设计研发的新型数据库管理系统,在经典数据库理论基础上,融入原创的有界计算、近似计算、并行可扩展和跨模融合计算理论,可满足金融、政企、能源等关键行业对高性能、高并发及高安全性的要求。
YashanDB的发展分为以下阶段:
2013~2018 原创理论体系证明和奠基
首创提出大数据计算复杂性理论,奠定大数据查询复杂性基础。
原创理论体系,奠定理论基础,A类论文60+。
有界计算、增量计算、近似计算、并行计算、大数据质量、跨模融合、关联分析、逻辑+A1、大数据计算复杂性理论。
数据库顶会最佳论文大满贯,十年时间检验奖。
2019 深算院正式运营
深算院正式运营,开启有界计算理论工程化。
汇聚了一批全球知名学府的青年科学家以及具有多年名企研发经验的资深工程师。
产品亮相CNCC,DeepTech专访报道,实现理论落地系统可行性初步验证。
2020~2021 原型验证,产品和工程落地
分布式分析原型开发完成可行性验证。
YashanDB完成一阶段原创理论、核心技术、自研系统,具备核心系统替换能力。
2022 权威测试认证,市场化元年
国产主流处理器、服务器、OS、中间件兼容认证。
第五届数字中国建设峰会“十大硬核科技”奖。
工信部下属机构权威测试,内核代码自主率100%。
信通院可信数据库集中事务型/分布式分析型评测。
30+客户,覆盖金融、政府、能源、交通、央企等多行业。
高端共享集群原型开发完成可行性验证。
2023~至今 市场复制,高端替代
金融、运营商、政府、能源等行业渗透和规模复制。
高端共享集群发布,分布式市场商用。
v22.2正式发布,功能、性能、稳定性等全面加强。
与中国工业互联网研究院签署战略合作协议。
崖山科技通过CMMI3级认证。
YashanDB通过等保3级认证。
与中地数码联合发布空间数据存储管理解决方案。
首次亮相可信数据库发展大会,上榜《中国数据库产业图谱》、参编《数据库发展研究报告》。
数据库应用创新实验室电信行业工作组首批共建单位。
# YashanDB部署形态
单机(主备)部署(简称:单机部署)
传统的关系型数据库理论与创新的底座引擎技术相结合,适用于集中式事务业务场景,支持主备形态。分布式集群部署 (简称:分布式部署)
继承单机能力的原生分布式处理系统,适用于分布式分析业务场景,支持主备形态。共享集群部署
基于共享存储的多活集群,提供计算/存储扩展和金融级高可用能力,适用于高端核心交易场景。
# YashanDB核心特性
行式存储/列式存储
支持HEAP行存表、TAC列存表、LSC列存表。
支持LIST/RANGE/HASH/INTERVAL分区类型和多种组合二级分区能力。
支持向量化计算。事务管理
支持完整事务ACID、细粒度锁管理、语句读写一致性,支持读已提交和串行化事务隔离级别、UNDO自管理、多版本并发控制。高性能查询
提供基于代价和规则的优化器模型。
支持MPP分布式执行方式,具备数据排序、稀疏索引、预读与缓存、数据压缩等存储技术,加上SQL引擎使用了分区剪枝、并行查询、条件下推等特性,带来高性能查询。数据复制
支持同步和异步两种复制模式,提供最大保护、最大性能等多种复制策略。备份恢复
提供数据物理备份和逻辑备份能力,支持全量和二级增量备份,并且支持基于时间点恢复(PITR)功能。高可用
提供一主多备、级联备高可用能力,支持手动切换和自动选主。数据库闪回
支持闪回查询、闪回修改以及回收站闪回能力。通用SQL能力
遵循ANSI SQL标准,支持常用SQL语法,提供丰富函数库和数据类型,支持高性能的PLAN算子。PL
支持存储过程、自定义函数、匿名块、高级包、JOB、触发器等能力。聚合内存
支持聚合内存(Cohesive Memory)核心技术,用于集群数据库各实例之间协同数据页的读写访问以及各种非数据类的并发控制。文件系统能力
可直接管理裸盘提供文件系统服务,在共享集群部署时为多节点集群提供并行文件读写能力。空间数据管理
支持ST_GEOMETRY数据类型,用于存储和访问符合开放地理空间信息联盟(Open Geospatial Consortium,简称OGC)制定的SFA SQL标准的几何对象。在线扩缩容
分布式部署形态中,分布式集群支持在线扩缩容,以满足客户业务发展需求。
# YashanDB适用场景
# 在线事务处理
YashanDB集中事务体系着眼于下一代基础设施软硬件的发展、以关键行业的核心应用场景作为牵引,提供高性能、高可靠的数据库底座,满足高并发在线事务处理的业务需求。
极高性能要求的在线交易
此类场景对事务处理的时效性和准确性要求严苛,并要求对数据进行高可靠保护。YashanDB拥有精细化的事务管理能力,强大的存储底座结合高速的SQL引擎,在保证数据强一致性的基础上实现卓越的事务处理性能。7*24小时不间断服务
YashanDB的高可用架构通过多副本日志同步机制可以将数据在多个数据中心之间进行实时同步并持久化,并通过Raft协议的自动选主实现主备在线自动切换,用户无感知的情况下保证系统的稳定持续运行状态。企业集中式管控
YashanDB的HTAP混合负载形态,基于"同一份数据,同一个引擎",同时支持在线实时交易及实时分析两种场景,支持高并发在线吞吐的同时,提供海量数据的实时在线分析能力。高可用无缝切换场景
金融、电信、电力等行业对高可用要求较高,常采用Oracle RAC这种依赖共享存储的高可用架构,YashanDB共享集群部署具备同样的高可用架构能力,当集群中出现单点故障时,会被另外一个节点接管,客户端透明切换,RPO为0,RTO最快只需要十多秒,保障核心业务连续运行不中断。
# 海量数据分析
YashanDB分布式分析体系基于有界计算理论的即时分析,专注解决大数据计算效率、数据生产即分析、海量数据存储成本及数据孤岛等数据库瓶颈难题(3V:Volumn、Velocity、Variety),为用户提供灵活的传统数仓加速、一站式数据仓库解决方案。
海量稳态数据分析
YashanDB的LSC表为列存表,通过列存结构组织数据,支持冷热数据分离,高压缩比的对象存储,通过数据排序,稀疏索引,下推过滤等技术实现海量数据的高性能查询,同时支持数据写入实时数据区提升事务性能,支持实时数据区与稳态数据区的静默转换和融合查询,主打海量稳态数据的交互式分析场景。Ad-Hoc交互式自助分析场景
对业务进行交互式探索分析,通过高性价比列存引擎、向量化执行引擎、高效的分布式算法等全自研技术达到秒级响应的查询分析体验。实时个性化推荐场景
基于海量用户历史行为日志数据进行多维分析,支持行为日志的实时入库,并完成历史标签和实时标签的秒级计算,支持通过各类标签组合进行用户圈选,提高营销成功率。