科技

Kimi K2.6开源:指挥300个Agent并行,连续编码13小时,多项基准全球第一

月之暗面正式发布并开源旗舰模型K2.6,带来其迄今最强的代码能力、长程任务执行和Agent集群能力。多项基准测试中表现亮眼。

多项基准全球领先

在博士级难度的Humanity's Last Exam中,K2.6以54.0%的得分位居第一。在评估Agent深度检索能力的DeepSearchQA中,以92.5%的高分大幅领先GPT-5.4和Gemini 3.1 Pro,小幅超过Claude Opus 4.6。在考察真实软件工程能力的SWE-Bench Pro中,K2.6以58.6%的成绩领先所有闭源模型。

连续编码13小时

K2.6可连续编码13小时、处理超过4000行复杂代码。在实测中,K2.6在Mac本地下载并部署了Qwen3.5-0.8B模型,跨语言使用Zig语言实现并优化模型推理。在超过12小时的不间断运行中,经历14轮迭代、调用工具逾4000次,将吞吐量从约15 tokens/s拉升至193 tokens/s。另一个案例中,K2.6重构了一个8年历史的开源金融撮合引擎,精准修改4000多行代码,将峰值吞吐量大幅提升133%。

300个Agent并行协作

由K2.6驱动的Agent集群架构支持300个子Agent并行完成4000个协作步骤。Kimi RL基础设施团队利用K2.6实现了连续5天的自主运行,由Agent负责监控、故障响应和系统运维。Kimi Agent模式已内置上百个官方推荐技能,支持创建和调用Skill。

价格与生态

K2.6维持分级计费:输入6.5元/百万token(缓存未命中),缓存命中1.1元,输出27元。支持262,144 token上下文窗口。已上线kimi.com、最新版Kimi应用、Kimi API和Kimi Code编程助手。开源意味着开发者可直接基于K2.6构建自己的Agent系统。

开源的意义

K2.6的发布标志着开源生态在Agent能力上达到了新高度。高性能、多模态、可复用的Agent能力不再是闭源巨头的专利。开发者可以基于开源模型构建自己的Agent系统,定制化程度远超闭源方案。