激光网
当前位置: 首页 > 光粒网 > 软件 > 正文

谷歌在MySQL中推进向量搜索 在LLM支持方面超越Oracle

2024-03-05 16:58:10  来源:激光网原创    

激光网3月5日消息,谷歌已经将向量搜索引入其MySQL数据库服务,超过了开源数据库的托管人甲骨文,后者迄今未能添加该功能,该功能被认为是执行大型语言模型的优势。

The Chocolate Factory宣布在多个谷歌云数据库中进行向量搜索,包括Cloud SQL for MySQL、Memorystore for Redis和Spanner,这是谷歌的分布式数据库管理和存储服务。

谷歌云数据库副总裁安迪·古特曼斯表示,在过去的12年里,谷歌在向量方面的创新速度相当快。

向量是 LLM 的基本元素,自 2022 年 ChatGPT 推出以来,LLM 已成为大型科技公司、政府和媒体的痴迷焦点。LLM 依赖于单词或语言的其他组件根据它们与其他单词的统计相似性表示为向量嵌入。谷歌是 Word2Vec 的幕后推手,Word2Vec 是一种于 2013 年推出的自然语言处理技术,尽管它已被 LLM 采用的 transformer 架构所取代。

通过将向量搜索引入MySQL,谷歌已经超越了Oracle的开源MySQL。

开源数据库支持公司Percona的技术布道者Dave Stokes表示,甲骨文工程部门没有计划支持向量或类似最近邻搜索社区版本的计划。

“可悲的是,甲骨文似乎将所有资源都投入到HeatWave中,同时为社区版做了绝对最低限度的工作,”他说。“这将使MySQL进一步落后于PostgreSQL和新的Vector数据库等其他选项。在将JavaScript和矢量嵌入到商业版本中时,社区版普遍缺乏新特性和功能,这将使社区客户寻求其他替代方案,例如谷歌提供的。

The Register 已联系 Oracle,为其提供回应机会。

不过谷歌并不是唯一一家将矢量搜索添加到MySQL服务的供应商。PlanetScale,一个基于MySQL/Vitesse的分布式事务系统,在去年10月宣布了这项新功能。

Redis 是一种流行的内存数据库,通常用作缓存和系统代理,它承诺在即将发布的版本中提供向量搜索。

上周,分布式文档数据库 Couchbase 在 DBaaS Capella 和 Couchbase Enterprise Edition 中引入了矢量搜索作为一项新功能。

Couchbase产品管理和业务运营高级副总裁斯科特·安德森表示,将矢量搜索添加到该平台是“使我们的客户能够构建新一波自适应应用程序”的下一步。

去年,Oracle 数据库、Cassandra、MongoDB、PostgreSQL 和 SingleStore 在其数据库系统中增加了对向量搜索的支持,而 Pinecone 等专业向量数据库如雨后春笋般涌现,以支持计算趋势。

Forrester Research副总裁兼首席分析师Noel Yuhanna表示,矢量搜索现在或多或少是任何严肃企业数据库的标准。

“那些没有它的人可能会看到他们的增长受到影响。根据我们的研究,大约35%的企业正在研究矢量数据库,预计在未来18个月内将增长到50%,“他说。

他说,矢量搜索对于GenAI应用程序来说变得至关重要,以帮助寻找类似的数据、图像和文档,并在客户情报、欺诈检测、聊天机器人和内容个性化方面出现应用。

Yuhanna说,虽然专业的向量数据库有其优势,但集成数据库为组织提供了更多的上下文和更丰富的数据体验。“没有一家供应商脱颖而出,因为矢量功能仍在不断发展,而且许多供应商还没有展示出高端规模。”

然而,目前只有大约22%的组织正在考虑为其数据库采用LLM/GenAI战略,尽管Forrester预计这一数字将在未来两到三年内翻一番。“我们看到的大部分需求都是针对新的GenAI应用程序,这些应用程序希望利用vector进行新的部署;对于现有数据库向 Vector 发展,我们至少还需要几年时间,“Yuhanna 说。

谷歌还试图让自己的GenAI模型更接近其分析环境。谷歌表示,它正在通过Vertex AI让其数据仓库系统BigQuery的用户访问Gemini。与 AI 和 ML 平台的新集成旨在帮助数据工程师和分析师使用 Gemini 模型为其 BigQuery 数据提供多模态和高级推理功能。

Yuhanna表示,将Vertex AI、BigQuery和BigLake更紧密地结合在一起,不仅可以帮助组织避免数据移动,还可以帮助提供洞察力,改善数据治理和安全性,删除冗余数据,并通过最大限度地减少管理要求来降低成本。

他表示,这是企业将非结构化数据与结构化BI式数据合并的趋势的一部分,现在约有四分之一的企业采用所谓的湖仓一体概念,以降低成本并在单一平台上运行BI、数据科学、AI/ML、运营洞察力和SQL分析。

免责声明: 激光网遵守行业规则,本站所转载的稿件都标注作者和来源。 激光网原创文章,请转载时务必注明文章作者和来源“激光网”, 不尊重本站原创的行为将受到激光网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:133 467 34 45@qq.com