技术文摘

Genesis AI开源机器人训练场:仿真评测与真实硬件相关性达89%

上次端出了惊艳的西红柿炒鸡蛋demo后,Genesis AI今天又发布了新东西——Genesis World 1.0,并开源了三套核心项目:Genesis World物理仿真平台、Quadrants跨平台GPU编译器、以及Nyx写实渲染器。这是一套为机器人和Physical AI准备的全栈仿真基础设施,底层编译器、渲染器和物理引擎都由团队自研。

解决什么问题?

Genesis World 1.0首先要解决的不是立刻生成更多训练数据,而是让机器人模型评测变得更快、更可重复。一次覆盖数百个任务、每个任务重复数百次的模型评测,如果放在真实世界里需要一台机器人和一名操作员连续运行200多个小时;而在仿真中,数万次episode可以在不到0.5小时内完成。更重要的是,仿真评测和真实硬件rollout的相关性达到89%——Pearson correlation 0.8996,MMRV 0.0166。

这意味着仿真有资格成为模型迭代的工具。关键在于:模型主要从真实世界数据中学习,再被放进仿真环境里做闭环评测。如果仿真里的表现排序和真实硬件上的表现排序一致,仿真才能真正帮助机器人scaling。

三层工具全栈开源

第一层是Genesis World物理仿真平台。底层统一多种物理求解器,上层通过生成式框架自动生成场景、任务和机器人数据。第二层是Nyx渲染器。游戏引擎优化的是视觉吸引力,离线渲染器追求物理准确但太慢——机器人需要的是另一种渲染器:能大规模生成接近真实摄像头的图像,并且足够快地支撑评测。Nyx的意义不是做出最讨好人眼的画面,而是尽量接近机器眼睛。

第三层是Quadrants编译器。机器人仿真不是只跑在一种机器上:工程师可能在MacBook上调试,大规模评测跑在GPU集群上,部分控制还可能跑在机器人板端。Quadrants支持CUDA、ROCm、Apple Metal、Vulkan以及x86/ARM64 CPU,目标是让同一套Python kernel能在不同硬件后端运行。

闭环评测的真正意义

Genesis AI特别强调closed-loop evaluation(闭环评测)。不是只在静态帧上预测动作,而是让模型在仿真环境里实际执行任务——一次轻微的抓取偏移、一次接触不良,在后续动作里被放大。需要测量的不只是某一帧预测得对不对,而是环境持续变化时它能不能感知、行动、纠错、最后把任务完成。

团队在14个任务上评估了三个不同规模的模型,每个任务在真实世界和仿真中各跑200个episode,再用100万次bootstrap估计置信区间。这种严谨的评测方法论,是Genesis World区别于其他仿真平台的核心竞争力。

Self-evolving Physical AI

Genesis AI提出的终极方向是self-evolving physical AI:内循环发生在仿真里——agent生成环境、模型执行任务、仿真系统评分、策略继续改进;外循环发生在真实世界——真实部署暴露edge cases、反过来校准simulator和任务分布。仿真不再只是现实世界的替身,它会变成机器人学习现实世界的一种方式。如果这条路走通,机器人研发将从人手设计任务、人手调参、人手排队上真机,逐渐变成一个能自我产生问题、验证答案、再回到现实中修正自己的系统。