新闻资讯

开源Hermes击败OpenAI Codex:Python如何逆天改命

开源阵营的里程碑时刻

一个完全用Python编写的开源Agent——Hermes,在11项CLI任务基准测试中以6:5击败了OpenAI用Rust编写的Codex。这不仅是开源对闭源的一次胜利,更是Python在AI编程Agent领域的一次逆袭。

长久以来,性能敏感的AI系统几乎都选择Rust、C++等编译型语言,Python则被定位为胶水语言和原型工具。Hermes的胜利证明:在Agent架构下,语言的选择不如架构设计重要。

关键数据

  • 测试结果:11项CLI任务,Hermes 6胜 vs Codex 5胜
  • 启动时间:从701ms降至258ms,优化幅度63%
  • GitHub热度:星标突破16万,社区贡献活跃
  • 完全开源:代码、模型权重、评测数据集全部开放

为什么Python能赢?

Hermes团队的核心洞察是:CLI Agent的瓶颈不在执行速度,而在任务规划和工具调用策略。Python的动态特性和丰富的生态库,让Agent能更灵活地组合工具链、处理异常情况、快速迭代策略。

相比之下,Codex虽然底层执行更快,但在任务理解的灵活性和错误恢复能力上有所欠缺。这正是Python生态的天然优势——当问题域需要快速试错和动态调整时,动态语言反而更胜一筹。

对开发者的意义

Hermes的成功传递了一个明确信号:AI编程Agent的竞争正在从模型能力转向Agent架构。谁的工具链设计更合理、错误恢复更鲁棒、上下文管理更高效,谁就能赢。这为中小团队和独立开发者打开了机会窗口——你不需要万亿参数的模型,好的Agent设计同样能打败巨头。