关于ZAKER Skills 合作
科创板日报 6小时前

谷歌推出 Gemini 3.5 系列模型 Omni 视频生成迎来关键突破

财联社 5 月 20 日讯(编辑 牛占林)在全球人工智能 ( AI ) 竞争加剧的背景下,谷歌宣布推出 Gemini 3.5 系列模型,以及一款用于模拟物理世界的新型 AI 模型,旨在在模型开发方面保持领先,同时为其庞大的用户群提供更多 AI 智能体服务。

谷歌在周二举行的年度开发者大会 ( Google I/O ) 上发布了上述消息,当前市场正高度关注 OpenAI 与 Anthropic 两家公司飙升的估值,这两家公司均计划最早于今年进行 IPO。

谷歌 AI 战略的核心依然是 Gemini 系列及相关工具。周二公司重点展示了 Gemini 3.5 Flash,这是该系列的一款轻量级产品。

谷歌首席执行官桑达尔 · 皮查伊表示,Gemini 3.5 Flash 在提供尖端能力的同时,其成本仅为同类顶尖模型的一半,甚至有时不到三分之一,同时保持了高智能水平。

皮查伊称 Gemini 3.5 Flash" 速度极快 "。谷歌同时宣布,该型号将成为全球 Gemini 应用和搜索 AI 模式的默认模型。

谷歌在博客中指出:" 用户无需再在质量与响应速度之间做取舍。" 公司还强化了 Gemini 3.5 Flash 的网络安全防护,使其 " 生成有害内容的可能性更低,也不易在安全问题上拒绝回答。"

至于重量级版本 Gemini 3.5 Pro,目前仅在内部使用,预计下月才会向更广泛的用户开放。

在 AI 智能体方面,谷歌推出了 Gemini Spark,这是 Gemini 应用中一款新型通用 AI 智能体,能够对关联应用中的信息进行跨平台推理。谷歌表示,该工具能够管理用户的数字生活,并代表用户执行操作。Gemini Spark 目前处于测试阶段,下周将首先向受信任的测试用户及 Google AI Ultra 订阅用户开放。

皮查伊表示:" 我们已经将智能体带给开发者和企业一段时间了。现在,我们专注于将这种前沿能力安全可靠地带给消费者,让每个人都能受益。"

随着越来越多的互联网用户使用聊天机器人,谷歌正在努力说服传统搜索用户信任其完成最少输入即可执行的任务。在公司资本支出大幅上升的情况下,华尔街关注谷歌是否能实现产品深度整合,而智能代理功能可能成为重要突破口。

AI 公司的市场预期持续上升,尤其是在 Anthropic 近期发布的 Mythos 模型背景下。据称,该模型强大到能够发现全球软件基础设施中的数千个未知漏洞。

谷歌的 AI 产品组合还包括 Gemini Omni,这是一款用于模拟物理环境的世界模型,可以根据用户的操作预测接下来会发生的情况。世界模型通常用于机器人和游戏领域,多年来一直是 DeepMind 重点研究方向。而 Omni 在物理模拟方面更准确,例如重力、流体动力学和动能等。

谷歌 DeepMind 首席 AI 架构师兼技术总监 Koray Kavukcuoglu 介绍称:"Omni 可以生成非常高质量的视频,并允许用户在生成后与视频进行互动。可以想象,这为学习和探索提供了类似教程的能力。"

Omni 可在 Gemini Flash、Gemini 应用、Google Flow 及 YouTube Shorts 中运行,支持图像和音频功能。谷歌在另一篇博客中指出,用户可利用 Omni 编辑视频并生成更逼真的图像效果。

" 拍摄一段视频,可以让 Omni 改变其中正在发生的内容。" 谷歌表示,这款 AI 模型能够 " 编辑动作、添加新角色或物体 "。

高质量视频的生成一直是 AI 工具的难点,而且对计算资源要求极高。OpenAI 在今年早些时候就放弃了其视频生成工具 Sora,部分原因就是为了将算力资源用于其他项目。

相关标签
科创板日报

科创板日报

上交所科创板电报,股市行情报道

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容