激光网
当前位置: 首页 > 光粒网 > 软件 > 正文

谷歌云推出新的GenAI驱动的数据和分析工具

2024-03-01 16:53:53  来源:激光网原创    

激光网3月1日消息,在去年的预览和开发阶段引入了一系列由人工智能驱动的生成式数据管理和分析功能后,谷歌云现在正在使其中一些工具普遍可用。

此外,这家科技巨头正在推出新一波的生成式人工智能功能。

2023 年 8 月,谷歌云推出了 Duet AI 与科技巨头的主要分析平台 Looker 之间的集成等功能。

该供应商还透露了谷歌云完全托管的数据仓库BigQuery与Gemini和Vertex AI之间的集成,Vertex AI是谷歌云的一个机器学习平台,包括生成式人工智能技术。

除了 Looker 和 BigQuery 的集成之外,谷歌云还推出了 AlloyDB AI,这是一个具有矢量搜索和存储功能的数据库。此外,它还公布了对数据湖仓一体BigLake对开源平台的支持。

在预览版的数据管理和分析功能中,谷歌云周四通过与 Vertex AI 的集成,将 AlloyDB AI 与 BigQuery 的 Gemini 模型一起正式推出。

与此同时,除其他新功能外,谷歌云周四还推出了BigQuery中新的非结构化数据分析功能,并支持其所有数据库的向量搜索。

使处于预览和开发阶段的工具普遍可用似乎相对微不足道,因为这是产品开发的自然进展。然而,根据 ISG 的 Ventana Research 分析师 David Menninger 的说法,生成式人工智能功能的普遍可用性是重要的一步。

自 OpenAI 推出 ChatGPT 以来的 15 个月里,生成式人工智能不仅成为谷歌云分析和数据管理产品组合的首要产品开发重点,也成为科技巨头 AWS 和微软的产品开发重点。此外,包括 Databricks 和 Snowflake 在内的数据平台供应商优先考虑生成式人工智能,包括 Alteryx、Informatica、Tableau 和 ThoughtSpot 在内的更专业的分析和数据管理供应商也是如此。

原因是生成式人工智能有可能扩大企业内部的分析使用,并提高那些已经处理数据的员工的效率。

生成式人工智能大型语言模型具有广泛的词汇表,可实现真正的自然语言处理,而 NLP 工具由于词汇量有限而无法实现。同时,真正的 NLP 几乎消除了编写代码来查询和分析数据的需要,从而扩大了其他复杂分析平台的潜在受众。

此外,LLM 可以被训练来生成代码和自动化流程,这通过消除耗时的重复性任务来提高现有数据专家的工作效率。

然而,尽管在数据管理和分析平台中增加生成式人工智能功能可能意味着什么,但数据管理和分析供应商推出的大多数工具仍处于某个开发阶段。

Tableau 于 2 月 22 日正式发布了其首款生成式人工智能工具,其他一些供应商也已正式发布了一些功能。但迄今为止,它们是例外。

因此,谷歌云现在正在提供一些由人工智能驱动的生成式数据管理和分析功能,这是有意义的。

“我们正处于将生成式人工智能功能投入企业生产的竞赛中,”Menninger说。“我们仍处于比赛的早期阶段,因此我们取得进展非常重要。但目前还没有一个供应商可以被宣布为赢家。

现在 AlloyDB AI 已正式发布,它将使开发人员能够通过使用向量来提供不断更新和训练人工智能的检索增强生成管道,包括生成式人工智能模型,从而构建人工智能应用程序。

同时,BigQuery 中的 Gemini 模型将 BigQuery 与生成式人工智能相结合,从根本上使客户能够将他们的 BI 连接到他们的人工智能。

谷歌云副总裁兼数据和分析总经理 Gerrit Kazmaier 和 Google 谷歌云数据库总经理兼副总裁 Andi Gutmans 表示,继 BigQuery 中全面推出 AlloyDB AI 和生成式人工智能功能后,谷歌云计划在 4 月全面推出更多数据管理和分析功能。

两位高管在周二的新闻发布会上发表了讲话。

Gutmans表示,这家科技巨头可能会将AlloyDB AI和BigQuery的生成式人工智能集成的普遍可用性推迟到Google Cloud Next '24,即定于4月9日至11日举行的用户大会。但是,这些功能现在已经准备好了,会议期间还将有许多其他产品开发要公布。

“客户对许多这些功能表现出极大的兴趣和兴奋 - 他们昨天想要它们,”Gutmans说。“我们不想人为地阻止我们准备好的能力,所以我们决定[在会议之前]把它们拿出来。请放心,我们在 4 月份有很多公告。

除了使 AlloyDB AI 和 BigQuery 与 Gemini 模型的集成正式可用之外,Google Cloud 还为其数据管理和分析产品组合推出了新一波生成式人工智能功能。

其中最突出的是强调向量搜索和存储。

商业智能历来基于结构化数据,例如财务记录和销售点交易。然而,据估计,世界上只有大约 20% 的数据是结构化数据,而世界上 80% 的数据是非结构化数据,例如文本、音频文件、视频和照片。

向量是数据的数字表示形式,当分配给文本、音频文件和其他非结构化数据时,它们会赋予其结构。一旦给定了带有向量的结构,就可以搜索、发现和操作以前的非结构化数据。

特别是,矢量搜索和存储正在成为一种使用企业专有数据提供和训练生成式人工智能模型的手段,因此该模型可以帮助为特定业务的决策提供信息。

AlloyDB AI 使用 SQL 自动生成向量嵌入,将 AlloyDB 变成向量数据库。

接下来,谷歌云将在其整个数据库套件中增加对矢量搜索的支持,在开源 Redis 数据库中提供矢量搜索,谷歌数据库 Cloud SQL、Spanner、Firestore 和 Bigtable 现在处于预览阶段。

Gutmans说:“我们的信念是,任何数据库,任何你存储可能用于生成式人工智能用例的操作数据的地方,都应该具有矢量功能。“好的向量应该只是数据库的基础能力。

与针对谷歌云数据库的矢量搜索功能一样,这家科技巨头在BigQuery中推出了新功能,旨在使客户能够操作非结构化数据。

谷歌于 2 月 14 日在 BigQuery 中推出了矢量搜索预览版。周四,谷歌云增加了与Vertex AI的集成 - 也是预览版 - 旨在使客户能够分析文本和语音以获得潜在的见解。

根据Kazmaier的说法,这些数据以前无法以有意义的方式使用。但是,将其与结构化数据结合使用将使客户能够为其数据开发新的应用程序,例如来自音频文件的客户情绪。

“这些数据通常不用于企业数据分析,”Kazmaier说。“我们正在进入一个拥有全新数据和分析能力的时代。

Menninger还指出,Google Cloud在Gemini、BigQuery和Vertex AI之间的集成,从非结构化数据文件中获取分析价值,这是值得注意的。

“Gemini 支持文本、图像和视频数据分析的多模态功能是新的,并且处于 GenAI 正在发生的事情的最前沿,”他说。“企业处理的大部分数据都是非结构化的,因此在任何分析中都包含这些信息以全面了解情况至关重要。”

除了强调使非结构化数据更易于访问之外,谷歌云还在其整个数据库套件中推出了 BigQuery 中的 RAG 支持,并支持 LangChain,这是一个用于构建生成式人工智能模型的开发者框架。

Gutmans 和 Kazmaier 表示,谷歌云将在不久的将来提供更多生成式人工智能驱动的数据管理和分析功能。

Kazmaier表示,随着这家科技巨头推出其他新工具,其指导原则之一将是能够访问不断扩大的数据信号。

他指出,大数据本质上是大量类似数据的集合。但是,释放非结构化数据进行分析实际上通过提供广泛的数据来丰富决策。

“我们倾向于将GenAI视为一种辅助功能,”他说。“但是,当你真正考虑数据和分析以及我们留下的挑战时,它们实际上是关于从所谓的大数据到我们所说的广泛数据。

与此同时,Menninger表示,在对生成式人工智能的适当关注中,不仅对谷歌云,而且对所有数据管理和分析供应商来说,继续增加传统的人工智能功能都很重要。

他指出,传统人工智能是欺诈检测和预测性维护等应用的一个重要方面。因此,它不应该被忽视。

“GenAI的投资正在吸走房间里所有的空气,”Menninger说。“重要的是要认识到,传统人工智能仍然是某些用例的重要组成部分。因此,我迫不及待地想看到谷歌和其他供应商将如何将GenAI和传统人工智能的世界结合在一起,以满足当今企业的所有要求。

免责声明: 激光网遵守行业规则,本站所转载的稿件都标注作者和来源。 激光网原创文章,请转载时务必注明文章作者和来源“激光网”, 不尊重本站原创的行为将受到激光网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:133 467 34 45@qq.com