科技

Kimi K2.6开源：指挥300个Agent并行，连续编码13小时，多项基准全球第一

📅 2026-05-31 14:53 · 👁 2 次阅读 · 📝 885 字 · ⏱ 约 3 分钟读完

月之暗面正式发布并开源旗舰模型K2.6，带来其迄今最强的代码能力、长程任务执行和Agent集群能力。多项基准测试中表现亮眼。

多项基准全球领先

在博士级难度的Humanity's Last Exam中，K2.6以54.0%的得分位居第一。在评估Agent深度检索能力的DeepSearchQA中，以92.5%的高分大幅领先GPT-5.4和Gemini 3.1 Pro，小幅超过Claude Opus 4.6。在考察真实软件工程能力的SWE-Bench Pro中，K2.6以58.6%的成绩领先所有闭源模型。

连续编码13小时

K2.6可连续编码13小时、处理超过4000行复杂代码。在实测中，K2.6在Mac本地下载并部署了Qwen3.5-0.8B模型，跨语言使用Zig语言实现并优化模型推理。在超过12小时的不间断运行中，经历14轮迭代、调用工具逾4000次，将吞吐量从约15 tokens/s拉升至193 tokens/s。另一个案例中，K2.6重构了一个8年历史的开源金融撮合引擎，精准修改4000多行代码，将峰值吞吐量大幅提升133%。

300个Agent并行协作

由K2.6驱动的Agent集群架构支持300个子Agent并行完成4000个协作步骤。Kimi RL基础设施团队利用K2.6实现了连续5天的自主运行，由Agent负责监控、故障响应和系统运维。Kimi Agent模式已内置上百个官方推荐技能，支持创建和调用Skill。

价格与生态

K2.6维持分级计费：输入6.5元/百万token（缓存未命中），缓存命中1.1元，输出27元。支持262,144 token上下文窗口。已上线kimi.com、最新版Kimi应用、Kimi API和Kimi Code编程助手。开源意味着开发者可直接基于K2.6构建自己的Agent系统。

开源的意义

K2.6的发布标志着开源生态在Agent能力上达到了新高度。高性能、多模态、可复用的Agent能力不再是闭源巨头的专利。开发者可以基于开源模型构建自己的Agent系统，定制化程度远超闭源方案。

本站文章来源于网络摘取整理发布，如有侵权请联系 hy@uicn.cn 删除

多项基准全球领先

连续编码13小时

300个Agent并行协作

价格与生态

开源的意义

相关文章

OpenAI Codex登陆Windows：Computer Use实测与Mac版差距

阿里百炼CLI开源+Qoder Cloud Agents：Agent上线从1个月缩至1天

ClickUp裁员22%百万年薪招AI人才：AI原生组织的残酷法则