Sora2 太卷了。
居然能预测 ChatGPT 的输出、渲染 HTML?!
先是编了一个问题:Write a playful haiku about a cat staring out the window.(写一首关于猫凝视窗外的俏皮俳句。)
然后又以 ChatGPT 回答的模式给出了音频回应:Whiskers pressed to glass. Birds gossip beyond the pain. Tail flicks. Daydreams fly.(中文大意是:" 胡须紧贴玻璃。鸟儿在窗外叽喳。尾巴轻摇。白日梦飞扬。)
全程以 ChatGPT 的机械女声回答,并且俳句音节还卡得严丝合缝。
这段视频场景 +LLM 推理的实测效果让一众网友惊叹,甚至有人说 "Sora2 模糊了视频生成和交互式 AI 的边界 "。
还有人让 Sora2 渲染粘贴的 HTML 代码,于是得到了如下效果:
看来 Sora2 不仅是视频生成器,还能充当浏览器。
当输入提示:
在桌子上放一张立着的纸,纸上画有两个箭头,一个在另一个下方,两个箭头指向同一个方向。然后在箭头前面放一个大的玻璃杯,使得从玻璃杯中可以看到箭头。接着将玻璃杯装满。
得到的效果为:
对此,网友表示:insane。
提示词:
生成《赛博朋克 2077》中使用巨龙坦克和帕纳姆的游戏画面。
一个是将巨蜥坦克的移动方式表现成了有轮子(实际应该是悬浮的)。
还有一个是帕纳姆的位置有错误(应该在坦克内,不是炮塔上)。
作者认为,虽然网络上存在该支线任务的视频教程,但毕竟只是支线任务,Sora2 能从众多信息中准确提取关键并整合,也反映了一定的智能和信息处理能力。
关于这些高能表现,有不少人认为 Sora2 可能是基于 LLM 训练的。
参考链接:
[ 1 ] https://x.com/elder_plinius/status/1973103844063322421
[ 2 ] https://x.com/elder_plinius/status/1973124528680345871
[ 3 ] https://x.com/jesperengelen/status/1973147038499086523
[ 4 ] https://x.com/pallavmac/status/1973141663557226806
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
年度科技风向标「2025 人工智能年度榜单」评选报名开启啦!我们正在寻找 AI+ 时代领航者 点击了解详情
企业、产品、人物 3 大维度,共设立了 5 类奖项,欢迎企业报名参与
一键关注 点亮星标
科技前沿进展每日见