上周,星巴克在 ChatGPT 里上线了点单功能。一个每天只喝固定款冰咖啡的人,花了比平时多三倍的时间才买到咖啡。
事件现场:一次 AI 点单实测

换成 ChatGPT 后,流程变成了这样:
打开 ChatGPT,输入 "@Starbucks" 加订单。ChatGPT 回复了一段关于冰咖啡的科普:" 冰咖啡正是你想要的——冷萃制作,不加糖,加入少量脱脂奶会让口感顺滑而不厚重。"
但咖啡还没点上。Pierce 发现,消息上方弹出了一个菜单,列出三个可能的选项。他想要的 "Iced Coffee" 排在第一,但必须点击 " 定制 ",再滚动选择杯型和加奶,否则购物车里的只是一杯中杯纯黑咖啡。
给妻子点 " 果味茶 " 更曲折。这个模糊描述 ChatGPT 确实处理了,给出的是冰绿茶柠檬——合理但错误。Pierce 自己想起来是 Passion Tango Tea,ChatGPT 又热情介绍了一遍这款茶,然后再次需要手动定制、加入购物车。
就在他终于凑齐两杯饮料时,屏幕弹出提示:" 此聊天中的商品与购物车中的商品来自不同门店。" 购物车被清空。
重新开始。最终耗时远超官方 App。
设计悖论:AI 对话 vs 确定性操作
星巴克 App 的点单逻辑是高度结构化的:门店→品类→规格→支付。每一步的选择范围被严格限定,出错概率极低。
ChatGPT 的接入试图用自然语言替代这套流程,却引入了两个冲突:
第一,模糊匹配的负担转移给了用户。当 Pierce 说 " 冰咖啡 ",系统需要确认是 "Iced Coffee" 还是 "Cold Brew" 或 "Nitro Cold Brew"。官方 App 里这三者在不同入口,不会混淆;AI 对话里它们成了需要用户二次确认的概率选项。
第二,对话流与交易流的错位。ChatGPT 擅长解释和推荐,但点单需要的是精确执行。Pierce 的观察很直接:系统花了篇幅描述饮料特点,却没减少他的操作步骤。
更隐蔽的问题是状态管理。当对话中切换门店,整个购物车失效——这在官方 App 里几乎不可能发生,因为门店是第一步就锁定的前置条件。
技术现实:大模型不是万能界面
这次集成由 OpenAI 的 " 任务 "(Tasks)功能支持,允许 ChatGPT 调用外部服务完成操作。星巴克是首批落地品牌之一,理论上代表了消费场景与生成式 AI 的结合前沿。
但实测暴露的落差值得注意:
自然语言输入的优势场景是 " 探索性需求 " ——用户不确定想要什么,需要推荐和比较。Pierce 妻子的 " 果味茶 " 属于此类,AI 确实给出了候选。
可咖啡点单的典型场景是 " 确定性复购 "。星巴克 2024 财年数据显示,会员订单中超过 60% 是历史订单的重复或微调。这类用户要的不是对话,是捷径。
ChatGPT 的界面设计也加剧了摩擦。菜单以卡片形式悬浮在对话上方,需要向上滚动查看;定制选项藏在二级弹窗里。这些交互元素与聊天界面的纵向信息流并不兼容。
Pierce 尝试的替代方案更说明问题:他后来直接用语音对 ChatGPT 说 " 点一杯大杯冰咖啡加少量脱脂奶 ",系统识别准确,但后续仍需手动确认门店、定制细节、检查购物车。语音节省了打字,没节省决策。
商业逻辑:谁在推动这场实验
星巴克不是唯一押注 AI 点单的玩家。2024 年以来,麦当劳测试了语音点餐机器人,Wendy's 与谷歌云合作推进 "FreshAI" 免下车服务,Domino's 的 AI 语音助手已覆盖部分市场。
驱动因素很现实:劳动力成本。美国餐饮业的时薪中位数过去三年上涨 23%,免下车窗口的订单处理速度直接影响翻台率。AI 的卖点是 7 × 24 小时稳定输出,不会疲惫、不会请病假。
但星巴克的 ChatGPT 集成指向另一个维度:用户触达。官方 App 的打开率有天花板,而 ChatGPT 的月活用户超过 4 亿。对星巴克而言,这是在消费者 " already in" 的场景里植入交易入口,降低获客成本。
代价是体验控制权的外包。官方 App 里,星巴克完全掌控界面、流程和数据;ChatGPT 渠道里,交互层由 OpenAI 定义,星巴克只提供后端接口。Pierce 遇到的界面混乱,本质是两家公司产品哲学的冲突。
更深层的张力在于品牌关系。当用户通过 ChatGPT 点星巴克,他们记住的是哪个品牌?OpenAI 的 " 任务 " 功能设计倾向于强化自身平台——对话历史、偏好记忆、跨品牌整合都留在 ChatGPT 侧。
行业影响:AI 代理的边界在哪里
这次测试的失败是场景错配,而非技术不可用。Pierce 自己也承认,如果他是 " 想尝试新饮料 " 的用户,ChatGPT 的推荐和解释可能有价值。
问题在于产品定位的诚实度。星巴克将 ChatGPT 入口宣传为点单渠道,实际交付的却是 " 对话式探索 + 手动确认 " 的混合体。用户预期被抬高,体验落差被放大。
这对 AI 代理(AI Agent)的落地有普遍启示:
高确定性、低容错场景不适合完全开放的对话界面。航空值机、医疗预约、金融转账等领域,用户要的是确认而非探索,结构化表单的效率优势难以替代。
自然语言的价值在于处理 " 意图模糊但约束宽松 " 的任务——旅行规划、礼物挑选、内容创作。这些场景的共性是:没有唯一正确答案,用户愿意在交互中逐步澄清需求。
咖啡点单卡在中间地带:对老用户太确定,对新人又不够开放。星巴克 App 的 " 历史订单一键复购 " 和 ChatGPT 的 " 告诉我你今天想喝什么 " 之间,存在未被覆盖的用户状态。
可能的进化方向是分层设计:AI 负责意图识别和选项收窄,最终确认仍回归结构化界面。或者,系统学习用户历史后,对复购场景直接跳过对话、生成订单草稿。
Pierce 的测试止于两杯咖啡,但提出的问题会持续:当每个品牌都想住进 ChatGPT,谁来解决体验碎片化?用户需要在十几个 "@品牌 " 之间切换,每个的交互逻辑各不相同,这比打开十几个 App 好在哪里?
平台方 OpenAI 的答案是 " 统一的自然语言界面 ",但实测证明,自然语言本身也需要被约束才能高效完成交易。约束的方式,最终又回到了各品牌自定义的菜单、选项和确认流程。
星巴克的实验没有给出答案,但划定了问题边界:AI 代理要取代的不是 App,而是 App 里那些用户已经厌倦、却不得不完成的重复操作。在找到这个切入口之前," 用 ChatGPT 点咖啡 " 只会是技术演示,不是更好的日常。