关于ZAKER 合作
手机中国 6小时前

有哪些大模型适合 OpenClaw?这份榜单获创始人亲荐

【CNMO 科技消息】近日,随着人工智能模型 " 龙虾 " 的热度持续攀升,开发者们在选择适配 OpenClaw 框架的最佳模型时,普遍面临一道难题:如何在成功率、速度和成本之间找到最佳平衡?对此,OpenClaw 之父亲 Peter Steinberger 自支招,推荐关注一个名为 PinchBench 的专项榜单。

Peter Steinberger

据 CNMO 了解,PinchBench 可被视为一份专为 " 龙虾 " 设计的 " 适配性指南 "。它由专注于 Agent 基础设施的创业团队 Kilo AI 推出,旨在通过模拟真实工作流,而非传统的知识问答或数学推理,来评估全球各大模型对 OpenClaw 框架的执行能力。榜单从成功率、运行速度和推理价格三个核心维度进行实时排名,为开发者提供了清晰的选型依据。

值得注意的是,中国模型在成功率和速度维度上展现出强劲竞争力。在成功率排名中,谷歌的 Gemini 3 Flash 以 95.1% 的成绩位居榜首,紧随其后的第二名和第三名均来自中国:MiniMax 的 M2.1 模型取得了 93.6% 的成功率,Kimi 的 K2.5 模型则以 93.4% 的成功率位列第三。值得注意的是,取得佳绩的 MiniMax M2.1 并非其最新的 M2.5 版本。

在运行速度方面,国产模型的表现更为抢眼。MiniMax 的最新一代模型 M2.5 超越了 Gemini、Llama 等国际知名模型,登顶速度榜。据介绍,M2.5 在相关测试中的任务完成速度较前代提升了 37%,其端到端运行时间已与 Claude Opus 4.6 持平。

然而,在价格维度上,国产模型目前仍面临挑战。榜单显示,最具价格优势的是 OpenAI 专为高性价比场景设计的 GPT-5-nano 模型,其输入和输出价格分别低至 0.05 美元和 0.4 美元每百万 tokens。相比之下,国内模型中价格较优的 MiniMax M2.1,折算后的成本约为 GPT-5-nano 的三倍。

目前,PinchBench 已完全开源,开发者可以自行运行测试或添加新任务,为持续变化的 " 龙虾 " 模型生态提供动态的适配参考。

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容