技术文摘

Genesis AI开源机器人训练场：仿真评测与真实硬件相关性达89%

📅 2026-05-30 02:31 · 👁 7 次阅读 · 📝 1,389 字 · ⏱ 约 5 分钟读完

上次端出了惊艳的西红柿炒鸡蛋demo后，Genesis AI今天又发布了新东西——Genesis World 1.0，并开源了三套核心项目：Genesis World物理仿真平台、Quadrants跨平台GPU编译器、以及Nyx写实渲染器。这是一套为机器人和Physical AI准备的全栈仿真基础设施，底层编译器、渲染器和物理引擎都由团队自研。

解决什么问题？

Genesis World 1.0首先要解决的不是立刻生成更多训练数据，而是让机器人模型评测变得更快、更可重复。一次覆盖数百个任务、每个任务重复数百次的模型评测，如果放在真实世界里需要一台机器人和一名操作员连续运行200多个小时；而在仿真中，数万次episode可以在不到0.5小时内完成。更重要的是，仿真评测和真实硬件rollout的相关性达到89%——Pearson correlation 0.8996，MMRV 0.0166。

这意味着仿真有资格成为模型迭代的工具。关键在于：模型主要从真实世界数据中学习，再被放进仿真环境里做闭环评测。如果仿真里的表现排序和真实硬件上的表现排序一致，仿真才能真正帮助机器人scaling。

三层工具全栈开源

第一层是Genesis World物理仿真平台。底层统一多种物理求解器，上层通过生成式框架自动生成场景、任务和机器人数据。第二层是Nyx渲染器。游戏引擎优化的是视觉吸引力，离线渲染器追求物理准确但太慢——机器人需要的是另一种渲染器：能大规模生成接近真实摄像头的图像，并且足够快地支撑评测。Nyx的意义不是做出最讨好人眼的画面，而是尽量接近机器眼睛。

第三层是Quadrants编译器。机器人仿真不是只跑在一种机器上：工程师可能在MacBook上调试，大规模评测跑在GPU集群上，部分控制还可能跑在机器人板端。Quadrants支持CUDA、ROCm、Apple Metal、Vulkan以及x86/ARM64 CPU，目标是让同一套Python kernel能在不同硬件后端运行。

闭环评测的真正意义

Genesis AI特别强调closed-loop evaluation（闭环评测）。不是只在静态帧上预测动作，而是让模型在仿真环境里实际执行任务——一次轻微的抓取偏移、一次接触不良，在后续动作里被放大。需要测量的不只是某一帧预测得对不对，而是环境持续变化时它能不能感知、行动、纠错、最后把任务完成。

团队在14个任务上评估了三个不同规模的模型，每个任务在真实世界和仿真中各跑200个episode，再用100万次bootstrap估计置信区间。这种严谨的评测方法论，是Genesis World区别于其他仿真平台的核心竞争力。

Self-evolving Physical AI

Genesis AI提出的终极方向是self-evolving physical AI：内循环发生在仿真里——agent生成环境、模型执行任务、仿真系统评分、策略继续改进；外循环发生在真实世界——真实部署暴露edge cases、反过来校准simulator和任务分布。仿真不再只是现实世界的替身，它会变成机器人学习现实世界的一种方式。如果这条路走通，机器人研发将从人手设计任务、人手调参、人手排队上真机，逐渐变成一个能自我产生问题、验证答案、再回到现实中修正自己的系统。

本站文章来源于网络摘取整理发布，如有侵权请联系 hy@uicn.cn 删除

解决什么问题？

三层工具全栈开源

闭环评测的真正意义

Self-evolving Physical AI

相关文章

汽车变成超级秘书：比亚迪发布超级智能体「迪迪虾」

GPT-5.6泄露：150万Token超级智能体，6月AI大战提前爆发

AI智能体从聊天到干活：国家三部门发文规范，百度阿里腾讯全面入局