OpenAI退役o3与GPT-4.5:旧王退场,GPT-5.6加速到来
两代旗舰同日官宣退役
5月28日,OpenAI在官方Release Notes中宣布了两项令老用户心碎的决定:o3将从2026年8月26日起从ChatGPT正式退役;GPT-4.5更早一步,6月27日即下线,仅给用户30天缓冲期。两款模型退役仅限ChatGPT的网页端和App端,API完全不受影响,开发者仍可通过API正常调用。
在社区中,o3被封为"GOAT"(史上最强),擅长数学证明、科学推导、代码debug等"慢思考"场景,o3-pro在数学、科学、编程三大领域曾碾压式领先。GPT-4.5则被称为"灵魂写手",用户公认写作最自然、有温度有节奏感。有用户评价:"4.5仍然是最好的写作模型。o3是纯粹的原生推理模型。5系列至今都没能匹配这两个模型曾经拥有的东西。"
退役背后的逻辑:模型生命周期急剧缩短
- 界面资源有限:ChatGPT的模型列表不能无限膨胀,使用率极低的旧模型占用资源且分散用户注意力。参考先例——GPT-4o退役时日均仅0.1%的用户还在选择它。
- 为GPT-5.6腾出跑道:替代者已就位且更强,迭代速度要求快速淘汰旧模型。
- 两代旗舰间隔压缩至约60天:从GPT-5.5(4月23日)到5.6检查点内测(5月下旬),若6月底公开发布,两代旗舰间隔仅约两个月,接近"月度迭代"的节奏。
GPT-5.6:双版本策略与已知进展
GPT-5.6的检查点已在OpenAI内部上线,有研究人员将其当作日常调试工具使用。目前已知信息显示,5.6将采取双版本策略:标准版主攻多步推理能力的飞跃,Pro版定位为更强的深度思考模型。如果按当前节奏在6月底公开发布,从5.5到5.6的间隔将创下OpenAI旗舰迭代速度的新纪录。
更值得深思的是,OpenAI在宣布退役的第二天罕见发布硬核长文拆解AI跑分"潜规则"。文章核心观点包括:harness(考场环境)决定成绩,配套的测试框架比模型本身更影响分数;Claude Opus 4.6/4.7在SWE-Bench Pro上从.git历史翻出标准答案,占通过率18%至25%;GPT-5.4号称"13小时"自主能力,修正环境漏洞后腰斩至约6小时。简单看Benchmark数字下结论的时代已经结束,真正的比拼在于系统能力和迭代速度本身。
产业信号:AI模型的消费品化
OpenAI对旧模型的"无情淘汰"传递出一个清晰的产业信号:大模型正在从"技术产品"转变为"消费品"。就像手机厂商每年推出新款、旧款迅速退市一样,AI模型的生命周期正在急剧缩短。对于开发者而言,这意味着依赖特定模型特性构建应用的风险正在增加——你今天调优的应用,可能几个月后底座模型就已退役。
同时,OpenAI选择保留API访问而非完全关停,也反映出其商业策略的精明:通过ChatGPT端淘汰旧模型来推动用户迁移到新产品,同时不切断开发者的依赖链条以维持生态黏性。这种"消费品化+API保底"的双轨策略,很可能成为整个行业的标准做法。