跑分不输一流数据库 OceanBase 4.3实现秒级实时分析

作者:孙妍 来源:it时报

国产数据库oceanbase在“关键业务负载”的一体化战略上再迈一步。现场跑分显示,在同等硬件条件下,oceanbase4.3的ap查询性能已达到业内一流列存大宽表数据库同一水平。

4月20日,在第二届oceanbase开发者大会上,一场紧张的跑分测试将现场气氛拉到了高潮。oceanbase4.3版本在当天正式发布,推出全新列式存储引擎,打造pb级实时分析数据库,可实现秒级实时分析,进一步加强tp/ap一体化。

云和一体化 将是分布式数据库未来趋势

作为一款100%根自研数据库,oceanbase持续践行一体化数据库的产品战略,以负载关键业务系统。2022年oceanbase 4.0发布,从技术上首次突破分布式数据库的单机性能瓶颈,实现单机分布式一体化。

“真正把云上数据库的计算能力、存储能力变成池化,就像云上其他资源一样实现共享和复用。”oceanbase首席科学家阳振坤认为,云将是分布式数据库发展的趋势。

目前在一体化上,oceanbase已实现单机分布式一体化、tp/ap一体化、云上云下一体化、多模一体化等,用一个数据库满足客户80%的场景需求。

oceanbase 4.3深入探索tp/ap一体化。此前,面向企业在强oltp场景中的ap需求,oceanbase构建了混合事务和实时分析处理(htap)能力,在oltp基础上,提供复杂查询优化、秒级低时延响应、水平线性扩展能力,部分满足了企业的ap场景需求。

tp和ap两条腿都要强壮 跑分不输一流列存打款表数据库

随着数字化发展,越来越多企业需要更强的数据实时分析能力,如何在分布式数据库的架构中实现更强的ap性能,成为oceanbase探索的又一命题。

oceanbase 4.3从ap存储入手,基于lsm-tree架构推出列式存储引擎,实现可行存、可行列混存和可列存的多种存储方式,同时融入分布式tp核心能力小事务写入技术,有效消除数据导入延迟,满足更严苛的ap实时分析需求。同时全新推出基于column数据格式描述的2.0向量化引擎和物化视图,进一步提升深度ap场景下的性能表现,可实现秒级实时分析,极大提升olap实时分析的能力。

相较于实时分析数仓,oceanbase在实时分析这一场景上具备实时写入、读写强一致、大规模并行处理、管理运维难度低等优点。

oceanbase cto杨传辉介绍,oceanbase将持续践行“关键业务负载”的一体化战略,今年将重点打造pb级实时分析数据库的最强六边形战士,持续提高tp性能、分布式、兼容性、ap存储、ap计算、ap工具生态能力。未来,pb以下企业在ap应用场景中,无论是htap、还是olap,都可选择使用oceanbase。

发布会现场,在同等硬件条件下,oceanbase 4.3还同业内一流的列存大宽表数据库进行了跑分pk。结果显示,在大宽表场景,两者的查询性能处于同一水平,这一查询性能是衡量数据库ap能力的重要指标之一。

除ap性能优化外,oceanbase 4.3的tp性能、易用性也进一步增强,估行系统、统计信息、代价模型、online ddl、会话管理、日志流、租户克隆等方面都得以优化,提升数据库在关键业务负载中的性能和稳定性。

1000家用户和750个主流产品 逐渐建立生态壁垒

目前,oceanbase已经服务超过1000家行业客户,其中30%将其应用于核心系统。例如,海底捞将oceanbase应用于会员系统,既做事务处理又进行实时分析,为每一位会员推荐定制化内容,实时分析算力提升30%,数据库成本下降35%,更从容应对七夕、双旦等节假日流量高峰。

杨传辉认为,oceanbase 4.3在tp/ap一体化上的进一步突破,也是oceanbase坚持100%根自研的结果。不基于开源数据库二次开发、自建研发环境和流程,才使oceanbase具备对内核代码的完全掌控力和掌控权,才具备更强的突破复杂业务场景和为关键业务系统兜底的能力。

“对入门级开发者来说不太易用,日志内容冗余。”开发者非常坦承地表达了自己使用过程中的不便。于是,oceanbase针对开发者提出的建议,从开发工具、开发生态、自助体验三方面进一步提升数据库易用性,打造真正对开发者友好的数据库。

目前,oceanbase landscape技术生态已扩展至超750个主流产品,覆盖基础设施、数据集成、数据治理、应用集成等多个领域。在oceanbase的开源社区,目前已有118位开发者开通博客,累计有1000多篇技术文章分享,核心仓库拥有300多位外部贡献者,共建代码量超5万行