谷歌将结合 Gemini 和 Veo AI 模型,以加速智能助手的创新与发展

手游美科网 2025-04-20 21:31:59 阅读 0评论

在近日的一档播客节目中,谷歌 DeepMind 的首席执行官米斯・哈萨比斯(Demis Hassabis)表示,谷歌计划最终将其 Gemini 人工智能模型与视频生成模型 Veo 结合,以提升 Gemini 对物理世界的理解。他指出,Gemini 从一开始就是为了多模态设计的,目的是实现一个 “通用数字助手”,这种助手能够在现实世界中真正帮助用户。

谷歌大模型Gemini

哈萨比斯提到,AI 行业正逐渐朝着 “全能” 模型的方向发展,这些模型能够理解和合成多种媒体形式。例如,谷歌最新的 Gemini 模型不仅可以生成文本和图像,还能生成音频。而 OpenAI 在 ChatGPT 中的默认模型也已经能够原生创建图像。此外,亚马逊也宣布将在今年推出一款 “任何到任何” 的模型。

实现这些全能模型需要大量的训练数据,包括图像、视频、音频和文本等。哈萨比斯暗示,Veo 模型的训练数据主要来自谷歌拥有的 YouTube 平台。他表示,通过观看大量 YouTube 视频,Veo2能够学习到世界的物理规律。

谷歌此前曾表示,其模型 “可能” 会根据与 YouTube 创作者的协议,从 “部分” YouTube 内容中进行训练。报告显示,谷歌去年扩展了其服务条款,以便能够获取更多数据来训练其人工智能模型。这一策略表明,谷歌正在积极寻求提高其 AI 技术的能力,以满足市场需求。

随着人工智能技术的快速发展,谷歌的这一计划也反映了业界对多模态 AI 的重视和未来可能的发展方向。结合 Gemini 和 Veo 的模型,将有助于为用户提供更丰富的互动体验,使人工智能能够更好地融入日常生活中。

划重点:

-

文章版权声明:除非注明,否则均为 手游美科网 原创文章,转载或复制请以超链接形式并注明出处。

发表评论

快捷回复: 表情:
评论列表 (暂无评论,人围观)

还没有评论,来说两句吧...

目录[+]