OceanBase更新一体化产品才干 打造AI时代数据底座 (oceanbase数据库官网)

admin1 3个月前 (10-26) 阅读数 67 #财经

AI 时代,要求怎样的数据库?10月23日,独立数据库厂商OceanBase在2024年度公布会上推出OceanBase 4.3.3 GA版本,更新向量检索与索引性能,成功SQL+AI一体化。该版本深度融合AI与数据库处置才干,支持多模态数据的融合查询,协助企业简化AI技术栈,优化AI运转构建效率。

CEO杨冰表示,OceanBase继续践行一体化产品战略,为AI时代打造易用、好用的数据底座。

杨冰:一体化数据库是 AI时代的数据底座

随着AI技术展开,越来越多的AI运转不再局限于纯文原本生成回答,触及的数据类型日益复杂,并且常存储于IT架构的不同数据库中,这对数据库提出了新的要求,包括优化性能与照应速度,要求数据库处置和存储不同类型的数据,并支持结构化、半结构化及非结构化数据的复杂融合查询。

杨冰以为,随同着互联网/移动互联网时代向AI时代演进,数据库也正从分散走向分歧,一体化数据库将成为AI时代的数据底座。如何经过一个分歧的数据库来处置一切类型的数据,并经过向量融合查询才干,让小团队也可以加快构建AI运转,是OceanBase一体化产品战略在AI时代的中心理考。

会上,杨冰演示了一个叫“望小京”的AI Agent Demo,请“望小京”引见两公里内、评分4.5以上、人均消费25元以内洁净卫生的奶茶店。他引见,这一Demo以OceanBase为数据底座,控制和处置结构化、半结构化以及非结构化数据,成功空间查询、相关过滤、向量计算等任务,为AI实时查询提供支持。

“以往构建一个复杂的AI运转,要求依赖多个不同的数据库、控制十分复杂的技术栈,同时还要求一个阅历丰厚且规模较大的团队。”他引见,正是由于OceanBase具有一体化才干,才得以经过一个数据库高效处置一切查询、并经过极简架构就可以成功数据控制和AI运转开发。以OceanBase为底座的“望小京”仅依托几位工程师、用一周时期就开发成功。

未来,OceanBase将成为蚂蚁集团的AI数据新底座,支持AI生活管家“支小宝”、AI金融管家“蚂小财”、AI瘦弱管家三大AI运转,及支付宝百宝箱智能体开发平台的数据控制。

4.3.3公布 ,介入向量才干

面对AI时代提出的全新应战,OceanBase继续推进技术更新。在公布会上,OceanBase推出4.3.3版本,这也是其面向实时AP场景的首个GA版本。

OceanBase CTO杨传辉引见,OceanBase 4.3.3在向量融合查询的关键才干上取得了清楚打破,推出全新的向量检索性能,成功SQL+AI一体化,深度融合AI与数据库处置。

详细而言,在对多模态数据的支持层面,4.3.3进一步扩充了对复杂数据类型的处置才干,新增Array类型,并对Roaringbitmap类型数据的计算性能启动了优化,为企业处置多样化数据结构提供更高的灵敏性。

在向量融合查询才干上,4.3.3新增向量检索才干,支持向量数据类型和向量索引,并基于向量索引提供弱小的搜寻才干。用户可经过SQL及Python SDK等方式灵敏调用OceanBase的向量检索才干,同时结合对的散布式存储才干、多模数据类型及多类型索引的支持,极大简化AI运转的技术栈,助力企业高效构建AI运转。

在多任务负载方面,OceanBase 4.3.3对AP(剖析处置)场景启动大幅性能优化,尤其是在海量数据剖析时,能够提供更短的照应时期和更高的吞吐才干。同时,4.3.3引入了列存正本的新外形,成功满足 TP 和 AP 负载的物理资源强隔离。该物理隔离机制可确保系统在处置事务型负载时,不受剖析型负载的影响,特地是在实时数据剖析和决策场景中,能够坚持系统的高性能与稳如泰山性。

公布会上,OceanBase与蚂蚁集团结合开发的向量库在业内规范的ANN Benchmarks基准测试中,针对GIST-960数据个表现出色。测试结果显示,该向量库在ANN Benmarks测试中性能远超其他算法,排名第一。特地是在 90% 以上的召回率区间,查询性能(QPS)相比此前最优算法 glass 优化 100%,相比基线算法 hnswlib 优化 300%。

杨传辉还强调,AI自然拥抱云,OceanBase作为一体化数据库,不只具有云上云下一体化才干,同时具有多云原生开通架构,这些优点都能有效地协助客户成功云与AI结合,满足客户在云+AI时代的数据控制需求。


新一代HTAP数据库崛起,MySQL生态的最佳归宿?

俗话说,天下大势,合久必分、分久必合。 数据库范围相同如此。 过去五十余年,数据库阅历OLTP和OLAP两种需求漫长的融合-分别-再融合的环节。 究其要素,数据库的开展一直与用户场景需求变迁严密相关。 如今,随着云计算和大数据的兴起,业务场景正在阅历史无前例的革新,数据库范围也掀起了一股HTAP浪潮。 Gartner在屡次报告中强调,HTAP是数据库范围最关键的开展趋向之一,也是用户数字化转型中关键的数据平台。 业界甚至以为,HTAP的兴起代表着数据库大融合时代的开启。 那么,为什么数据库大厂和云服务巨头们均纷繁押宝HTAP?开源+多云为何是HTAP普及的助推剂?面对新一代HTAP数据的崛起,多年积聚构成的MySQL生态终于找到最佳归宿? 放在几年前,HTAP或许还会被以为是数据库范围的小众产品,能否成气候还有待观察。 而随着数据资源、数据消费习气和数据驱动型场景出现庞大变化,用户需求与传统数据库之间的供需矛盾日渐突出,使得HTAP这种具有“同时支持OLTP和OLAP、创新计算存储框架、去ETL”等特征的新时代数据库成为无法阻挠的趋向。 如今,简直一切数据库大厂和云服务巨头都在规划HTAP。 例如,OceanBase去年推出的 3.0版本中就正式宣布向HTAP数据库进军;往年5月,Google Cloud发布HTAP云端数据库AlloyDB,为PG用户提供了HTAP数据库服务;再加上Oracle MySQL Heatwave,甚至连SnowFlake也发布Unistore来“蹭”HTAP的热点。 假设细数近一年以来的HTAP新品,会发现简直全部都树立在云端之上。 新一代HTAP+云正在成为数据库市场关键的潮流。 例如,PingCAP近日发布的TiDB 6.0,也是与云端严密咨询的新一代HTAP数据库。 理想上,PingCAP是HTAP数据库范围十分关键的一个引领者。 早在TiDB 3.0起,PingCAP就正式转向HTAP,从OLTP主引擎+OLAP辅佐才干,到OLTP引擎+外接剖析引擎,再到OLTP引擎+融合剖析引擎,PingCAP在HTAP范围稳打稳扎,一个版本上一个台阶。 如今,随着TiDB 6.0的发布,针对HTAP启动了更多成熟性改良,TPC-C 性能也较 5.0 版本优化到达 76.32%,TiDB 6.0还增强了多个企业级特性,以更好适宜云时代用户关于HTAP数据库的需求。 固然,有人质疑以后HTAP是新瓶装旧酒,并无太多新意。 但业界普遍构成共识:新一代HTAP与过去完全不同,开源+云孕育而出,很多都有AI加持,而且是为数据矫捷而生,拥有过去史无前例的创新生机与迭代速度,并逐渐构成数据库技术革新的新潮流。 PingCAP CTO 黄东旭也直言:“TiDB近年来的加快退化与迭代,得益于开源和云的助力。 ” HTAP之所遭到用户喜爱,某种水平是由于用户关于数据矫捷性的极度渴求。 “在数字化时代,客户最为在乎的是如何加快走向市场。 这要求数据矫捷性,而HTAP恰恰是数据矫捷的中心才干。 ”黄东旭如是说。 最近几年,“海量、实时、在线”的需求越来越普遍,少量采用 MySQL 和 PostgreSQL 开源数据库的新一代企业要求优化关于热数据的实时在线剖析才干,这类需求普及简直一切的互联网企业以及从事线上业务的数字化转型企业。 关于新颖数据的实时剖析才干直接选择了这些业务的生死存亡,传统的 OLTP+OLAP+ETL 的数据架构曾经严重阻碍了消费者体验,这种诉求催生了 HTAP 的技术革新。 而真正协助HTAP与用户需求成功对接的则是开源+云。 众所周知,开源近年来在数据库范围的盛行和影响力日积月累,DB-Engines数据显示,全球383款数据库中开源数据库占据51.7%,六款开源数据库进入到前十,开源正在成为像HTAP这种新时代数据库的创新源泉。 以PingCAP的TiDB为例,其产品研发体系树立在开源体系和开源社区的基础上,成功了一年一个大版本、一个月一个小版本的迭代速度。 黄东旭泄漏道:“开源是TiDB的第一个增长引擎,经过开源体系,开发者、奉献者、布道者和用户能够很好串联起来,构成飞轮效应,让产品能够走向减速迭代和创新的正向循环。 ” 据悉,TiDB每年会有超越 40% 的代码更新,而这些代码有很大一部分由外部奉献者所共享。 TiDB开源项目不时在全球和中国开源项目生动度中首屈一指。 假设说开源改动了HTAP产品的开发形式和迭代速度,那么云则能够为HTAP产品提供用户最为直接的需求反应。 众所周知,云数据库一改以往传统数据库部署、运维、扩展等难题,以云服务的方式让数据库经常使用愈加简易;愈加关键的是,随着云计算的普及,云上用户群体继续参与,来自云上用户群体的需求反应无时无刻都在出现,关于数据库产品的退化与迭代至关关键。 “真正的产品迭代是如何缩短用户疑问/需求的反应时期。 云无疑为数据库等基础软件提供了这样的价值,让产品可以更好地迭代。 ”黄东旭如是说。 以TiDB为例,自去年五月全托管的数据库即服务(DBaaS)产品 TiDB Cloud 公测版发布以来,曾经陆续登陆亚马逊云 科技 、谷歌云等全球知名云服务商的Marketplace,并在往年5月份正式全球商用;往年 6 月与阿里云协作上线阿里云云市场,成为为数不多的跨全球三朵云的数据库服务。 在众少数据库产品之中,MySQL仰仗着开源、不要钱、适宜互联网场景等优势,终年位居全球最受欢迎数据库的前三。 依据Slintel网站的统计数据,在全球相关型数据库市场中,MySQL市场份额最高,到达43.04%。 过去二十年里,开源MySQL数据库关于各行各业影响至深,捕捉了来自互联网、金融、批发、交通等多个行业用户的心,可谓“万人迷”。 例如,在中国就有超越9成的金融机构都运行了MySQL数据库。 但任何数据库潮流都是“需求变化+技术革新+架构创新”融合的产物,MySQL是如此,HTAP亦不例外。 如今,场景的数据规模、业务并发量、处置速度要求跟以往相比早已不是一个数量级。 此时,MySQL数据库的局限性愈发突出,扩展性很难满足用户需求,想继续取得增长的企业不得不经常使用分库分表方案,但这又会形成数据架构的复杂性。 新一代HTAP数据库无需分库分表,且具有实时海量规模的OLTP和实时数据剖析才干,还拥有极为出色的扩展性,与很多业务场景的海量买卖实时数据展现、颠簸运转的需求高度契合,HTAP仰仗技术架构优势崛起已成肯定。 “用户需求侧最大的变化就是很多用户要求借助热数据成功运营级别的实时剖析,取得实时洞察以支持决策,这极大推进了新一代HTAP数据库的需求。 ”PingCAP副总裁刘松补充道。 虽然MySQL曾经加出列存引擎Heatwave来取得HTAP才干,但关键处置规模化查询的疑问,系统自身架构并未发生反派性变化,扩展才干、OLTP吞吐量依然有着很大局限。 “智能新动力 汽车 跟传统燃油车在外表看简直没区别。 数据库也相似,像TiDB这种新一代HTAP数据库,从架构设计、应对场景和经常使用体验等角度,都与传统数据库有着极大的区别。 ”刘松笼统比喻道。 理想上,与过去SAP HANA这种小众、昂贵的HTAP不同,新一代HTAP拥有极强的兼容性,像Google Cloud、PingCAP这些数据库厂商都借助新一代HTAP架构为采用 MySQL或许PG开源数据库的企业拓展 OLTP和OLAP的才干范围。 例如,Google Cloud发布的HTAP云端数据库AlloyDB,为单机版PG生态用户提供了最好选择,TiDB则成为MySQL生态的最佳归宿。 PingCAP少量用户中有很多TiDB与MySQL混合部署的成功案例;得益于 TiDB 的开放性,TiDB 也可经过和其他数据服务产品“混搭”构成新的数据服务处置方案, 如经过相同是开源的大数据计算引擎 Flink 混搭构成实时数仓处置方案,扩展 HTAP 数据库的才干边界。 黄东旭则直言,HTAP数据库除了产品、技术之外,尤为要求关心用户体验,“HTAP应该让用户觉得好用,屏蔽掉数据库的复杂性。 ”据悉,PingCAP是2022 Gartner Peer Insights“Voice of the Customer” 云数据库范围独一中选的中国数据库公司,客户总体评分到达 4.7 分(满分 5 分),在一妥中选企业中位列第一。 在介入Gartner Peer Insights评分的PingCAP用户中,像互联网、金融等重点行业用户均高度认可HTAP现代数据库理念。 总体来看,往年是HTAP的大年,各大厂商纷繁在市场中上新。 随着新一代HTAP数据库产品的增多,整个市场关于HTAP数据库理念和产品的接受与采用将会提速。 而随着新一代HTAP数据库继续完善,让广阔MySQL生态用户群真正看到了大数据时代一条绝佳的迁移途径。

2023年6月中国数据库排行榜:OceanBase 延续七月踞榜首,华为阿里谋定快动占先机

2023年6月,中国数据库排行榜发布,OceanBase延续七个月位居榜首。 在排行榜前十中,GBase南大通用逾越TDSQL,其他数据库坚持稳如泰山。 OceanBase以高分优势延续蝉联榜首,展现出加快开展的态势。 戴明明,科大讯飞技术中心运维部初级DBA专家,解读了排行榜的现状与趋向。 前十数据库排名显示,除了GBase南大通用的亮眼表现,其他数据库排名维持稳如泰山。 OceanBase在延续七个月领跑后,本月得分再次逾越700分,展现出微弱竞争力。 随着本月排名前十的数据库得分和排名状况的详细剖析,可以明晰地看到中国数据库市场的竞争格式。 向量数据库成为新风口,华福证券的报告预测其市场规模将清楚增长。 AI技术的推进,使得向量数据库在数据存储方面展现出庞大潜力。 目前,已有多个中国向量数据库介入排行榜,其中Milvus、cVector、Vearch等位列前三。 向量数据库的引入,不只拓展了大模型的运行边界,还优化了大模型的实时性和适用性,有望成为数据库细分范围的领头羊。 数据库市场的竞争日益剧烈,政策和市场的双重推进下,国产数据库热度不时攀升。 技术的创新和产品更新成为数据库厂商的中心竞争力。 排行榜不只反映了厂商在产品更新和技术创新上的努力,还显示出国产数据库的“马太效应”。 排名前十的数据库厂商占据主导位置,展现出在资源投入、产品开发和生态树立方面的优势。 以后,国产数据库关键集中在相关型数据库范围,NoSQL、大数据等方向的数据库仍依赖国外开源技术。 在政策支持和市场需求的驱动下,国产数据库片面替代国外产品仍需时日。 这一趋向标明,中国数据库市场正面临从依赖出口到自主可控的转变,未来将有更多的企业选择和信任国产数据库。 从排行榜中,我们可以看到数据库市场的灵活和开展方向。 排名的变化反映出市场对数据库产品性能、性能和技术创新的注重。 随着数据库技术的不时提高和运行场景的多样化,数据库市场将展现出更大的潜力和创新空间。 关于数据库行业来说,这是一个充溢机遇与应战的时代,等候国产数据库在技术创新和市场运行中取得更清楚的效果。

版权声明

本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。

热门