APP下载

关于ZAKER

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

合作

差评 1小时前

你的 AI 越来越蠢？因为它学会见人下菜碟了。

以下文章来源于差评前沿部，作者江江

大伙有没有感觉，现在各家的 AI，好像越来越蠢了？

事情是这样的，前几天我心一狠，给 OpenAI 充了个 200 刀的会员，想着试试现在的 ChatGPT 强到啥程度了。

结果，我给他丢了个算术题，求解 5.9 = x+5.11，哥们直接给我算崩了。。

《这题真是幼儿园级别》？

堂堂 200 刀人工智能，还不如我 20 块的计算器啊？

但，我记得 GPT-4 刚出那会儿，我还让它算过高数啊？难道模型升级还会砍智力吗？于是我给它丢了个微寄分过去。

结果，哥们还会换元法，一通操作下来，看着还真没啥问题，评论区的大学生可以验验真假。

所以，两次算数用的都是 GPT-5，咋还给我见人下菜碟？

本以为是 OpenAI 飘了，结果我上网一查发现，这事儿还不是 GPT 一家干的，甚至有点行业趋势的意思。

前几天美团发布的开源模型 LongCat，其中就提到自己用一个路由器提高效率。

DeepSeek V3.1 发布时，也说过自己一个模型可以有两种思考模式。

而同样是 AI 巨头的 Gemini，在 Gemini 2.5 flash 发布时，就引入了相似的模式，让模型自己决定怎么用脑。

总的来说，大伙都在让自己的模型 " 该思考时再思考 "，该偷懒的时候偷懒。

这么做的动机，也很好理解，那就是省钱。从 OpenAI 发的资料来看，通过这种 " 让模型自己决定要不要思考 " 的方式省掉的 tokens 还真不少，GPT5 输出 token 数就少了 50%-80%。

DeepSeek 官方发的图表中也显示，新模型 tokens 消耗也下降了大概 20%-50%。

省一半 token，这是什么概念？咱普通人可能体会不到，但对 OpenAI 这样的大公司来说，可能就是一大笔开销。

去年央视就有报道，ChatGPT 每天耗电超过 50 万度，在如此庞大的基数下，省出来的部分，够一个上万户家庭的小镇用上一天了。

这也难怪奥特曼在网上跟网友说，你们跟 GPT 说声谢谢都要花我上千万美元。之前的高级模型，一句谢谢也能让它思考几分钟，还真有点浪费在里面。

所以，AI 这看题下菜的能力，到底咋练成的呢？OpenAI 没公布具体原理，但 2023 年有篇论文叫《Tryage: Real-time, Intelligent Routing of User Prompts to Large Language Models》，专门分析了这个问题。

在 GPT-3.5 出来那阵，大模型还不会自己调节思考能力，每个问题都能让 AI 无限烧脑。

为了提高效率，研究者就想出来了一种叫 " 感知路由器 " 的模块，它本质上，就是在混合模型里塞了一个小巧的语言模型。

在前期训练时，路由器就和刷题一样，对 " 使用哪个模型最佳 "，做出自己的预测。

哪个模型适合深度研究，哪个模型适合快速思考，当然有标准答案。系统就会将这个预测分和标准答案进行比对，计算出两者间的误差。接着通过微调路由器内部的参数，来减小这个误差。

当它刷数百万道题之后，就逐渐学会怎么给你的提示词，分配合适的模型了。

当一个新提示词进来，AI 内部的路由小模型就会先扫一眼，评估一下这问题配不配我动脑。因为路由器比较轻量级，所以这个评估过程几乎是瞬时的。

而除了 OpenAI 这法子，AI 还有一种偷懒的思路，那就是把不同的 token，导向不同的神经网络。

像美团的 LongCat 就采用了这种方法，从报告来看，他们采用了一种叫 " 零计算专家 " 的机制。

通常来说，在你输入提示词之后，你的提示词会拆分成一个又一个的 tokens，交给模型内部的神经网络去处理。

但 Longcat 在处理之前，会先把它交给一个叫 "Top-k Router" 小路由器，它就像一个流水线上的调度员，在收到 token 的时候，会判断这个 token 处理起来是复杂还是简单。

同时在它的内部，有很多不同分工的神经网络，我们把它们叫做专家。

这些专家，有的喜欢做难题，有的喜欢做简单题，当然，也有摸鱼界专家。

比如 " 请用 Python 写一个快速排序 " 这句话，"Python" 和 " 快速排序 " 就是重点，" 请 " 和 " 一个 " 就没那么重要。

像这些没啥用的 token，咱就可以丢给那些摸鱼大王了，因为它们根本不需要怎么处理。这下，你就知道 " 零计算专家 " 这个名字是怎么来的了。

这也能解释为啥大伙都在吹这个模型 " 太快了 "。

总的来说，这种设计对模型厂商来说算好事，不仅省钱还能提升训练效率。

从用户角度讲，模型更快了，价格更便宜了。但我感觉，这玩意是把双刃剑。如果用不好，还真是实打实影响用户体验。。

记得 GPT-5 刚上线，这路由器就翻车了。用户发现自己怎么都调不出来它的思考模式，问什么它都懒得思考，像摆烂一般只会 " 啊对对对 "，连 "blueberry 里有几个 b？" 都数不明白。

而且，这也算剥夺了用户的选择权。OpenAI 一刀切掉了 4o，搞得很多网友在网上哭诉说自己失去了一位朋友。

这又让奥特曼又暂时为 Plus 用户把 GPT-4o 端了上来，并允许 Pro 用户继续访问其他旧模型。

那这个操作，不就变相说明，在发布的时候，这个路由模型就没调好嘛。

咱再说 LongCat，它的确很快，但在思维上限上，还是打不过其他大模型的。像我就同时给 LongCat 和 DeepSeek 丢了一个同样的问题：什么叫 " 但丁真不是中国人，但丁真是中国人 "？

LongCat 这边刷刷出答案，但没解读出来这句话的幽默感；而 DeepSeek 虽然慢了点，笑点解析得却很清楚。

LongCat

DeepSeek

就像我问你 114*514 是什么，你说当然是 58596 啊，算得确实很快啊，但其实我只想让你配合我搞抽象。

当然，对路由器罢工，咱也有些解决办法，那就是在提示词里加入 " 深度思考 ""ultra think" 这些字眼，路由器收到后会尽量调用更强大的模型。

不过也只能说治标不治本了，多用几次可能就叫不醒了。。

这就说明 AI 确实罢工了，咱只能等几个小时再来了。

所以说到底，方向是好的，技术是新的，但现阶段的体验也确实只是 " 还行 " 的。当然，大模型成长速度比我们想的更快，咱还能坐等更快更好的模型出世。

撰文：不咕

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

神经网络美团 python 中国人

相关阅读

你的AI越来越蠢？因为它学会见人下菜碟了。

差评 34分钟前

11099元佳能发布新款85mm人像镜头：F/1.4大光圈 14枚镜片

快科技 4小时前

iPhone Air延期发售博主：苹果错判形势备货不充分

数码测评 7小时前

唐国强等多位明星用华为新三折叠屏批奏折网友：对味了

快科技 7小时前

雷军自曝：已取证数百账号发起诉讼数十起正在等待逐一开庭

快科技 7小时前

联手Bose猛卷音质！倍思一口气发布三款旗舰耳机，最低只要679元？

雷科技 2小时前

数据与AI双引擎驱动智能未来，2025外滩大会论数据进化之道

中国网财经 5小时前

苹果iPhone 17系列支持电荷泵+AVS快充：实际峰值能到60W

快科技 12小时前

辛巴退网！超级头部带货主播时代落幕

36氪 12小时前

泡泡玛特杀入老铺黄金腹地，但labubu二手价格撑不住了

虎嗅APP 2小时前

智界新款首批车主交付百万级品控背后的价值升级

车讯互联 7小时前

狂刷2亿播放，副业月入2万，又一隐秘赛道爆火

36氪 13小时前

张杨：《信托公司管理办法》全面革新回归信托本源

21世纪经济报道 13小时前

最新评论

没有更多评论了

差评

订阅

觉得文章不错，微信扫描分享好友

扫码分享

热门订阅换一批

Blockchain News