APP下载

关于ZAKER

合作

量子位昨天

蒙娜丽莎让大模型们几乎全军覆没！网友：懂了，AI 不会眯眼睛

又一个让大模型几乎全军覆没的难题出现了。

注意看，这张图画的是谁？

如果不够明显，那再眯着眼睛看呢。没错，就是蒙娜丽莎。

这张来自日本艺术家北冈秋吉前几天创作的一张图，结果直接把一众大模型难倒了。

ChatGPT 只能分辨出这是一张脸。。

Gemini 则是直接识别错了人。

网友：懂了，大模型不会眯眼睛。

大模型不会眯眼睛？

为了验证这一推论，咱们也进行了一波简单实测。既然直接问「画的是谁」问不出来，那给一点提示，让它可以尝试眯着眼睛。

首先来看 ChatGPT 的表现。

它能准确判断出这是一张视觉错位图，也通过「眯着眼睛」识别出来了具体的脸部轮廓，结果在最后关头识别错了。

而再让它深度思考一下，答案给不出来了。

Gemini 的回答则还停留在各种颜色的条纹，也辨认出这是个侧脸的轮廓。

Grok 则直接表示无法辨认，让我提供一张更清晰的照片，emmm …

再来看看国产玩家的表现，还是挑出三个来看看。

豆包的回答与 Gemini 类似，能够判断出图像的风格、人脸轮廓，但是无法判断具体任务。

但选择深度思考之后，它深入研究了故障艺术的通道分离特性，然后从黑色轮廓中判断出这是爱因斯坦（？？？？

可能这蓬松的长发不是一个类型的吧。

将这个问题交给 Qwen。负责回答这个问题的是 Qwen3-235B-A22B，在完成深度思考之后，它发现了这是个人的侧脸剪影。但还是没有判断出画的这个人是谁。

而元宝、讯飞的回答如下：

△元宝

△讯飞星火但 o3-Pro 一次性回答对

不过在一众模型全军覆没之际，也还是有得分选手。

比如o3-Pro。

网友进一步分析了原因。这可能与模型推理轨迹有关。比如像 o3（非 pro 版）思考链路里，它通常会在 Python 中旋转、增加对比度、裁剪等。而 o3-pro 显然推理能力更强。

但有人怀疑了，它是不是用搜索了。

不过这被发现者驳回了。首先 o3 也可以用搜索，但无法做到这一点。而且从 o3-pro 的推理摘要中看，它只有在模糊后才能看到它（可能是通过使用工具）。而且如果只问 " 这是什么？"，它也不起作用。

还有尝试了三次的 GPT-4o。

不过这合理怀疑，只是它偶然猜对了。

因为网友在它第一次打错之后，就给模型提示说这是一张著名的画作。于是就莫名玩起了「海龟汤」的游戏。。。

又或者让 o4-mini-high 先人为地模糊图像以使其 " 眯眼 "，然后就能识别图像。

好了，感兴趣的朋友可以去尝试一下。有挑战成功的友友，可以在评论区分享下提示词经验 ~

参考链接：

[ 1 ] https://x.com/svpino/status/1940924964431188137

[ 2 ] https://x.com/goodside/status/1941296192656376297

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

专属 AI 产品从业者的实名社群，只聊 AI 产品最落地的真问题 扫码添加小助手，发送「姓名 + 公司 + 职位」申请入群～

进群后，你将直接获得：

最新最专业的 AI 产品信息及分析

不定期发放的热门产品内测码

内部专属内容与专业讨论

点亮星标

科技前沿进展每日见

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

省下一半芯片钱，小米YU7用消费级芯片是创新还是冒险？

汽车频道 2小时前

最轻薄的折叠屏手机来了！荣耀Magic V5仅8.8mm厚

数码测评 4小时前

华为Mate 80系列参数曝光：首发麒麟9030+国产5000万像素主摄

数码测评 3小时前

客服回应小米路由器偷偷减配：不影响产品功能和性能

快科技 1小时前

8300mAh手机行业最大电池！曝荣耀X70明天官宣

快科技 2小时前

大众点评回应给刷好评开绿灯：少数商家违规已下线处罚

快科技 2小时前

京东的野心，在哈萨克有个模板

钛媒体 3小时前

传前阿里公关一号位回归本人回应：有事情搭把手再正常不过

快科技 3小时前

跨国公司女高管转行按摩师：每个月只工作两周，月入10万

财经新闻 7小时前

华为Mate 80系列影像配置曝光：超大底主摄+定制模组

数码测评 5小时前

LG显示颠覆传统！电视产线测试新型OLED技术：分辨率突破在望

快科技 5小时前

微软年内第二次开启裁员，再裁9000人

21世纪经济报道 5小时前

完美、B站内部反腐；网易《万民长歌》停止开发

21世纪经济报道 5小时前

微软Win11 25H2新特性曝光：可移除预装Microsoft Store应用

快科技 6小时前

三星承认尖端制程竞争力不足定价比台积电便宜30%

快科技 6小时前

量子位

觉得文章不错，微信扫描分享好友

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频剪辑

AI视频剪辑

AI智能客服

AI工具箱

AI写稿助手

AI口语陪练

我的订阅