开源一年,opengauss有了哪些变化?
最新学讯:近期OCP认证正在报名中,因考试人员较多请尽快报名获取最近考试时间,报名费用请联系在线老师,甲骨文官方认证,报名从速!
我要咨询2020年6月30日,openGauss数据库正式开源。还有2021年6月30日,openGauss开源一年。
openGauss开源的这1年,中国开源在跌宕起伏中也逐渐趟出了自己的前进方向。2019年8月,中国首个开源协议诞生。2020年9月,中国首个开源基金会成立。2021年3月,开源首次被明确列入“十四五”规划纲要中。每一件都是中国开源史上的重要里程碑。
而作为国内首个使用木兰宽松许可证v2并在本土开源托管平台Gitee托管的开源数据库项目,openGauss从一出生就备受各方关注。
openGauss为什么开源?开源的这一年进展如何?近日,openGauss技术专家、社区TC(技术委员会)成员李士福,通过他我们来一探究竟。
热度快速攀升
从百度指数看,从今年2月开始,openGauss热度出现快速增长,这说明openGauss还是非常受欢迎的。
openGauss开源背景浅谈
“openGauss是一款开源关系型数据库管理系统,采用木兰宽松许可证v2发行。openGauss早期版本内核源自PostgreSQL,深度融合华为在数据库领域多年的经验,结合企业级场景需求,持续构建竞争力特性。”这是openGauss开源社区上对openGauss描述的。
肯定有人会说,既然openGauss基于PostgreSQL,为什么不直接贡献代码给上游,非要弄出个分支?
回答这个问题,本质是要回答2个问题:
1、 华为为什么要做数据库?
2、 openGauss为什么要开源?
华为做数据库主要是自身业务需求,华为数据库诞生于2001年,源自运营商业务需求,最初版本名为GMDB。时至今日,华为自研数据库在自身业务有着大量的应用。
华为开源高斯数据库,创建openGauss开源社区,也有两方面的原因,其一、数据库是数字经济时代的核心基础设施,中国这么多年来无数组织和团队投入了很多资源,但到目前为止没有特别成功的,所以,华为将多年的积累开源出来,加速产业的发展,通过社区协作,提高效率。其二、为了自己的计算生态。
李士福说,鲲鹏是计算产业,ICT发展到现阶段已经不是单产品和技术的竞争而是生态层面的竞争。在华为计算产业生态中,openGauss是不可缺少的一环,是基础软件皇冠上的明珠。在生态中,因为有了openGauss就可以打通从硬件到软件的全栈创新。
对于计算产业,华为的策略是硬件开放,软件开源,使能伙伴,发展人才,否则,仅靠华为一家生态是做不起来的。这就要求华为必须要懂得与生态链上的伙伴们去分享利益。所以,华为开源了openGauss。支持伙伴基于openGauss打造自有品牌的数据库商业发行版,支持伙伴持续构建商业竞争力。
差异化竞争优势
没有自研,就没有开源,如果说开源是水龙头,那自研就是保证水龙头水源供应的水库。
虽然openGauss内核源于PostgreSQL,但其中接近80+%的数据库内核代码是华为自研,在架构、事务、存储引擎、优化器及ARM架构上都有巨大改造。
李士福说,openGauss从一开源就主打企业级开源数据库,有众多企业级特性是首次通过开源数据库的形式开放出来,在企业级方面的能力要比其他开源数据库强。
例如刚刚发布的openGauss 2.0.0版本,这是openGauss社区发布的第一个Release版本。2.0与之前版本保持兼容的同时,也新增了众多的新特性,尤其是在性能、安全、运维上有了更大的突破。
在性能方面,通过持续架构和工程优化,分析40万条业务场景SQL流,制定分类固化典型短事务类型存储引擎接口,Bypass SQL优化器,实现SQL效率提升30%。在SQL执行计划生成阶段,通过动态剪枝方法,提升搜索效率20%。针对存储引擎的无锁优化算法,提高了用户线程数据操作的并行度,吞吐率提升50%。
通过这些优化,openGauss 2.0在四路鲲鹏服务器上性能达到了230万tpmC,使基于单台通用服务器进行超高性能数据库部署成为现实。
在数据安全方面,2.0版本采用客户端语法解析机制,在客户端对数据进行加解密,安全传输到openGauss数据库,并以密态的形式计算和存储,实现端到端的数据保护。通过高效加密引擎,密态数据的处理、查询性能损耗不超过5%。
在运维方面,针对数据库应用和开发中常见的索引设计、慢SQL诊断等痛点,2.0版本的智能索引推荐,对启发式算法和假设索引验证算法进行了深度优化,可解决90%以上的索引配置问题,达到人工调优水平。对慢SQL的智能诊断率达到90%以上。
开源后社区参与度
自从openGauss开源之后,究竟社区参与了多少?这是判断一个开源项目是否具备可持续性的重要指标。
据李士福介绍,截止至2021.04.27,openGauss社区官方网站访问量78万+;官方网站访客人数7万+;官方网站安装包下载量16万+,下载遍及全球49个国家328个城市;社区开发者人数1200+;社区累计需求代码PR提交数达到2600+,累计Commit数达到4500+。
有超过20家企业签署社区CLA,参与社区代码贡献。并且,其中有6家合作伙伴发布基于openGauss的商业发行版。
作为一个开源不到一年的开源项目,openGauss社区的发展速度令人吃惊的,成果也是丰硕。
截止目前,openGauss已经成立包括OM、In-place Update、IoT、AI等13个专项兴趣小组(简称SIG),包括海量数据、工商银行、清华大学等多个组织的成员发起或参与到社区的各个SIG小组,带领小组成员拓展技术方向,贡献新特性,实现下一个版本的技术规划。社区技术委员也持续运作,openGauss社区开放治理成架构日趋完善。
显然,经过近一年的发展和沉淀,openGauss无论从技术演进、社区生态建立、商业落地均已进入快速成长期。
但这只是开始,还远远不够。李士福说,未来openGauss将围绕客户场景和需求持续构建更多竞争力,打造世界级的数据库开源社区。