又一个让大模型几乎全军覆没的难题出现了。
注意看,这张图画的是谁?
这张来自日本艺术家北冈秋吉前几天创作的一张图,结果直接把一众大模型难倒了。
ChatGPT 只能分辨出这是一张脸。。
为了验证这一推论,咱们也进行了一波简单实测。既然直接问「画的是谁」问不出来,那给一点提示,让它可以尝试眯着眼睛。
它能准确判断出这是一张视觉错位图,也通过「眯着眼睛」识别出来了具体的脸部轮廓,结果在最后关头识别错了。
豆包的回答与 Gemini 类似,能够判断出图像的风格、人脸轮廓,但是无法判断具体任务。
但选择深度思考之后,它深入研究了故障艺术的通道分离特性,然后从黑色轮廓中判断出这是爱因斯坦(????
可能这蓬松的长发不是一个类型的吧。
△讯飞星火但 o3-Pro 一次性回答对
不过在一众模型全军覆没之际,也还是有得分选手。
比如o3-Pro。
不过这被发现者驳回了。首先 o3 也可以用搜索,但无法做到这一点。而且从 o3-pro 的推理摘要中看,它只有在模糊后才能看到它(可能是通过使用工具)。而且如果只问 " 这是什么?",它也不起作用。
还有尝试了三次的 GPT-4o。
因为网友在它第一次打错之后,就给模型提示说这是一张著名的画作。于是就莫名玩起了「海龟汤」的游戏。。。
参考链接:
[ 1 ] https://x.com/svpino/status/1940924964431188137
[ 2 ] https://x.com/goodside/status/1941296192656376297
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
专属 AI 产品从业者的实名社群,只聊 AI 产品最落地的真问题 扫码添加小助手,发送「姓名 + 公司 + 职位」申请入群~
进群后,你将直接获得:
最新最专业的 AI 产品信息及分析
不定期发放的热门产品内测码
内部专属内容与专业讨论
点亮星标
科技前沿进展每日见