当前位置：首页 > 光粒网 > 软件 > 正文

谷歌宣布开发下一代文本到视频生成器

2024-01-28 19:50:46　来源：激光网原创　

谷歌研究院的人工智能研究人员团队开发了一种名为Lumiere的下一代基于人工智能的文本到视频生成器。该小组发表了一篇论文，描述了他们在arXiv预印本服务器上的工作。

卢米埃尔可能以早期摄影设备的先驱莱特兄弟的名字命名，它允许用户输入一个简单的句子，如“两只浣熊一起读书”，并获得一个完整的视频，显示两只浣熊正在这样做，而且它的分辨率非常高。新的生成器通过创建更具吸引力的结果，代表了文本到视频生成器开发的下一步。

谷歌将新生成器背后的技术描述为“创新的U-Net时空架构”。它旨在在单个模型通道中生成动画视频。

演示视频显示，谷歌增加了额外的功能，例如允许用户通过突出显示其中的一部分并输入说明来编辑现有视频，例如“将衣服的颜色更改为红色”。生成器还会生成不同类型的结果，例如样式化，其中创建的是主题的样式，而不是全彩表示形式。它还允许子样式，例如不同的样式引用。它还执行电影成像，用户可以在其中突出显示部分或全部静止图像并对其进行动画处理。

在公告中，谷歌没有具体说明是否计划向公众发布或分发卢米埃尔，这可能是由于可能创建违反版权法的视频可能会产生明显的法律后果。

免责声明： 激光网遵守行业规则，本站所转载的稿件都标注作者和来源。激光网原创文章，请转载时务必注明文章作者和来源“激光网”，不尊重本站原创的行为将受到激光网的追责，转载稿件或作者投稿可能会经编辑修改或者补充，如有异议可投诉至：Email：133 467 34 45@qq.com