新闻资讯

WorldArena最终榜单揭晓:中国模型包揽前二,具身智能世界模型新格局

事件背景

2026年5月29日,由清华大学牵头、联合普林斯顿大学、新加坡国立大学、北京大学等多个学术机构共同研发的WorldArena基准评测揭晓了Track-1(视频质量赛道)最终结果。中国模型包揽前二——考拉悠然联合上海码极客、同济大学空间智能团队打造的"考拉悠然无界世界模型"开源版本BLM斩获全球第一,闭源版本同样位居前列。这一成绩不仅是中国AI在具身智能领域的重大突破,更标志着世界模型技术格局正在发生深刻变化。

WorldArena评测体系

  • 发起机构:清华大学牵头,联合普林斯顿、新加坡国立大学、北大等
  • 评测维度:视频质量、功能效用两大核心维度
  • 视频质量子维度:视觉质量、运动质量、内容一致性、物理规律遵从等6个子维度16项数值指标
  • 功能效用评测:基于智能体在模拟环境中的决策与执行能力

WorldArena的独特价值在于它是首个系统评估"具身世界模型"的综合基准。传统的视频生成评测只关注画面质量,而WorldArena进一步考察模型是否理解物理世界的运行规律——生成的视频不仅要看起来真实,还要在物理上自洽。例如,一个球从桌上滚落的场景,模型需要正确模拟重力、碰撞和摩擦,而不是生成"看起来对但物理上不可能"的画面。

中国模型登顶的意义

考拉悠然BLM模型在WorldArena上的夺冠,具有多层次的行业意义:

  • 技术层面:证明中国团队在视频生成+物理理解这一高难度交叉领域已达到世界领先水平
  • 开源层面:BLM作为开源版本夺冠,意味着全球开发者都可以基于这一模型进行二次开发,推动具身智能应用加速落地
  • 生态层面:成都考拉悠然联合上海码极客、同济大学团队的跨区域协作,展示了产学研结合在中国AI创新中的有效性
  • 竞争层面:中国两家模型拿下WorldArena前二,在全球具身智能世界模型领域形成了领先优势

具身智能的行业前景

世界模型是具身智能的核心基础设施。无论是人形机器人在真实环境中导航,还是自动驾驶系统模拟交通场景,都需要世界模型提供对物理世界的准确预测。WorldArena榜单的揭晓恰逢其时——2026年被多家科技公司定义为"智能体之年",而智能体从数字世界走向物理世界的关键一步,就是拥有可靠的世界模型。

从投资角度看,具身智能赛道正在成为AI领域的新焦点。宇树科技科创板过会、英伟达发布Isaac GR00T系统、特斯拉Optimus持续迭代,都指向同一个趋势:世界模型+具身智能将成为2026年下半年AI领域最重要的投资主线之一。中国模型在WorldArena上的优异表现,为国内具身智能产业的发展提供了坚实的技术基础。