技术文摘

Grok V9-Medium 1.5T训完:Musk自爆生产环境跑的是0.5T小模型

5月25日,Elon Musk发推宣布Grok V9-Medium(1.5T参数)训练完成,距公开发布还有2-3周。这条推文同时引爆了三个话题:1.5T参数规模、Cursor数据进补训、以及一个让所有人意外的自爆——当前生产环境跑的其实是0.5T的小模型。

自爆生产环境真实规模

Musk原文:「This will be a major improvement over the 0.5T v8-small that currently serves all Grok production traffic。」——「currently serves all Grok production traffic」是产品口径上的自爆。在此之前,外界对Grok 4.x系列的实际参数规模长期只能猜测,xAI官方价格表只列alias(grok-4、grok-4-fast、grok-code-fast-1、grok-build-0.1),从不公布参数。

Musk把「0.5T V8-small」和「production traffic全量」两个词放在一起,等于公开承认:你现在在X、grok.com、SuperGrok订阅里用的Grok,本质都是「small」级别的模型。这解释了为什么Grok在某些复杂任务上表现不如预期——它一直在用远小于宣传的模型跑生产流量。

Cursor数据进补训:合作链条浮现

「A lot of Cursor data was added in supplementary training」——这是Cursor-SpaceX合作落地的第一个公开技术信号。2026年4月SpaceX与Cursor公开宣布「acquisition option / training partnership」时双方都只谈算力(xAI Colossus给Cursor训Composer 2.5),没有任何一方公开承认数据流向是双向的。这是第一次有xAI一方公开说Cursor的数据被加进自家基础模型的补训。

这意味着什么?Cursor拥有海量的真实编程对话数据——开发者如何提问、如何修改代码、如何调试——这些数据对训练编程能力极强的模型来说是金矿。Grok V9在编程任务上的提升,很可能就来自这些数据。Cursor截至发稿未公开回应这一表述。

1.5T在当前frontier中的位置

1.5T是目前公开的最大参数模型之一。对比:GPT-5.5约1T参数,Claude Opus 4.7未公开但估计500B-800B,Gemini 3.5 Pro未公开,DeepSeek-V4-Pro未公开。Musk表示重点强化困难编码任务,对标GPT-5.6和Claude Sonnet 4.8。Fine-tuning正在进行,强化学习几天内启动。

2-3周后公测:6月模型大乱斗

预计6月中旬发布,将撞上GPT-5.6、Sonnet 4.8、Gemini 3.5 Pro。这将是2026年AI模型最密集的发布窗口。对开发者来说,选择哪个模型不再是「谁最好」的问题,而是「在什么场景用什么模型」的策略问题。Grok V9在编程能力上的强化,加上Cursor数据的加持,可能会让它成为开发者工具链中的一个新选项——前提是它真的能在实际编码任务中兑现1.5T参数的承诺。