【CNMO 科技消息】近日,月之暗面 Kimi 正式发布并开源 Kimi K2.6 模型,全面精进代码、长程任务执行和 Agent 集群能力。Kimi K2.6 现已上线 kimi.com、最新版 Kimi 应用、Kimi API 和 Kimi Code 编程助手,所有用户均可使用。

Kimi K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升,在博士级难度的完整版 " 人类最后的考试 "(Humanity ‘ s Last Exam)、考察模型真实软件工程能力的 SWE-Bench Pro、评估 Agent 深度检索能力的 DeepSearchQA 等基准测试中均取得行业领先的成绩,持平或优于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 等闭源模型。

在另一项测试中,K2.6 自主完成了对拥有 8 年历史的开源金融撮合引擎 exchange-core 的深度重构,历经 13 小时连续作业,迭代 12 套优化策略,通过 1000 余次工具调用对 4000 多行代码进行了精准修改,实现了 185% 的中位吞吐量跃升。
Kimi K2.6 还大幅增强了 Agent 自主化执行能力。由 K2.6 模型驱动的 "Agent 集群 " 架构迎来大升级,现在支持 300 个子 Agent 并行完成 4000 个协作步骤,实现更大规模的并行化,任务完成度和交付质量相比 K2.5 有显著提升。针对 OpenClaw、Hermes Agent 等主动式 Agent 框架,K2.6 展现出极强的自动化任务处理能力,支持长达 5 天的持续自主运行。基于 K2.6 的 Agent 实现了连续 5 天自主运行,负责监控、故障响应和系统运维。Kimi 内部的 Claw Bench 测试结果显示,K2.6 相比 K2.5 综合性能提升了 10%。
借助 K2.6 更强的代码和视觉理解能力,Kimi Agent 模式支持创建和调用技能,系统已内置上百个官方推荐技能,包括 Kimi 内部专家团队创建的投研技能包。Kimi 还开启了小范围内测的 "Claw 群组 ",目标是拥抱开放、异构的生态,多个 Agent 与人类作为真正的协作者共同运行。在 "Claw 群组 " 中,K2.6 担任协调者,根据 Agent 的技能画像和可用工具动态匹配任务,实现能力的最优配置。
Kimi K2.6 现已面向所有免费用户、付费订阅用户、Kimi Code 和企业 API 用户开放。为庆祝 K2.6 模型 API 上线,Kimi 开放平台同步开启了最高 30% 的限时充赠活动。
版权所有,未经许可不得转载