OpenAI Codex登陆Windows:Computer Use实测与Mac版差距
OpenAI发布Codex 26.527版本,Computer Use功能正式登陆Windows,AI可看到屏幕并自动操作软件。实测发现相比Mac版存在部分限制,但远程控制能力已可用。
最新资讯
共 240 篇文章 · 15 天更新 · 分类「科技」· 2026-05-31 · 33 篇
OpenAI发布Codex 26.527版本,Computer Use功能正式登陆Windows,AI可看到屏幕并自动操作软件。实测发现相比Mac版存在部分限制,但远程控制能力已可用。
阿里云百炼CLI在GitHub开源,一行命令接入150+模型。同时Qoder推出Cloud Agents全托管平台,将Agent上线时间从1个月缩短至1天,企业级AI Agent开发进入快车道。
协作软件公司ClickUp裁员22%同时部署3000个内部AI Agent,开出100万美元年薪招聘AI原生人才。Wix、Webflow、Meta跟进,AI正在改写职场去留规则。
ETH Zurich团队证明:攻击者只需对图片做微小扰动,就能让最强VLM自信且错误地作答。Grok把马斯克识别为连环杀人犯,ChatGPT为阴谋论「盖章」,Claude把同一张男女照判为不同人。
小米MiMo负责人罗福莉发布5000字技术博客拆解降价真相:非营销手段,而是SWA架构+双池KVCache+GCache+LLM-Router+MTP六项工程叠加,缓存命中率93-95%,单位成本下降95%+。
Altman投资的现代终端Warp在GitHub开源,采用AGPL许可证。支持300个Agent并行,内置自然语言交互,15小时Star数飙到3.5万。OpenAI成为创始赞助商。
月之暗面开源旗舰模型K2.6:Humanity's Last Exam得分54%全球第一,SWE-Bench Pro 58.6%领先所有闭源模型。支持300个Agent并行,可连续自主运行5天。
Reddit用户ShelZuuz耗时200+小时、4年未解的C++渲染Bug,Claude Opus 4仅用几小时、30次提示就修复了。但他强调:AI本质上还是「初级开发者」,需要人类手把手指导。
MiniMax工程负责人剧透M3采用MiniMax Sparse Attention(MSA),百万token预填充加速9.7倍、解码加速15.6倍。放弃全注意力回归稀疏,核心是「在真实KV上做区块选择」。同步启动A股上市。
Anthropic为Claude推出AI Fluency评分功能,基于11项指标分析用户AI使用习惯并打分。已有网友测出7.5分满分,AI评价人类的时代正式开启。
哈佛史上最年轻正教授、弦论天才尹希被曝离开学术界加盟OpenAI。他曾直言AI可将物理研究提速100倍,此举标志着顶级科学家流向AI行业的趋势加速。
GitHub Copilot 6月1日起从固定订阅制切换为按token计费。有用户月费从29美元飙至750美元。开发者社区引发广泛不满,部分用户宣布取消订阅。
AMD发布3nm工艺MI355X,1850亿晶体管、288GB HBM3e显存,推理性能达B200的2.2倍。奥特曼压轴登场宣布OpenAI将使用AMD芯片。明年MI400搭载423GB HBM4。
黄仁勋6月1日在GTC Taipei 2026发表主题演讲,披露Blackwell和Vera Rubin两大平台2027年营收将达1万亿美元,展示下一代Feynman架构。
Anthropic捂得最严实的Claude Mythos,被22岁的Kye Gomez从头推导出来并全开源。核心是循环深度Transformer,同一权重循环跑16次。770M参数打平1.3B。
Google I/O 2026四巨头宣布AI已全面跨入Agent时代。Jeff Dean预言软件将变得「即用即弃」,Agent一晚上把Python工具链翻译成Go,速度提升10-20倍。
银河通用联合英伟达、清华、北大发表论文LDA-1B,提出「先理解物理,再学习操作」的世界模型路线,颠覆「完美数据」崇拜的模仿学习范式。
Nvidia在Computex 2026发布N1和N1X处理器,3nm工艺,N1X配备24核+16核、48MB缓存、250W TDP。9月开售,N1售价599美元,N1X售价1299美元。
Box CEO Aaron Levie警告企业领导层出现「AI精神病」:不了解岗位的决策者用AI替代员工。ClickUp裁员22%为AI腾位置,2026年科技行业已裁15万人。
2026年高等教育三大技术变革:AI赋能教学设计而非替代、学生数字学习体验成为战略重点、微证书市场进入质量竞争时代。
苏黎世联邦理工学院研究发现,对图片添加人眼难辨的微小修改就能误导GPT-5.4、Claude Opus 4.6等顶尖VLM给出错误回答,可被用于传播虚假信息、攻击他人、绕过审核。
开源编程语言Zig明确禁止提交AI辅助生成的代码,QEMU、NetBSD、OBS Studio等项目也采取类似政策,引发关于开源精神与AI效率的深层辩论。
DeepSeek宣布V4-Pro API永久降价至原价1/4,输出价格仅为GPT-5.5 Pro的1/36。同时组建Harness团队对标Claude Code,押注国产昇腾芯片破局。
OpenAI宣布o3于8月26日、GPT-4.5于6月27日从ChatGPT退役,API不受影响。GPT-5.6检查点已在内部上线,6月底可能公开发布。
OpenAI宣布o3和GPT-4.5退役。GPT-4.5仅给30天缓冲。GPT-5.6已在热身,两代旗舰间隔压缩到60天。OpenAI同时发布长文拆解AI评估潜规则。
南洋理工大学谢之非团队提出Pask主动智能体,使用底层小模型流式意图检测+上层Agents执行架构,实现首个能实时、有深度、基于个人全局记忆自进化的主动AI。
Anthropic发布Opus 4.8,补上4.7短板。Dynamic Workflows支持数百个并行subagents,代码缺陷漏报率降至前代四分之一。FastMode便宜三倍速度快2.5倍。
Chatbot增长见顶,Agent迎来开局。Claude访问量逆势增长34%,ChatGPT出现负增长。投资逻辑从「对话」转向Agent,Y Combinator W26名单中大量Agent创业项目。
中国科大团队成功研制九章四号,操纵3050个光子量子态。生成一个样本仅需25微秒,而全球最快超算需要1042年。成果发表在Nature上。
南京大学团队在0.6纳米厚的二硫化钼材料上研制出世界首颗多位并行微处理器「梦启-1000」。打通晶圆生产线兼容的全流程,加速二维半导体产业化。
支付宝「AI付」累计完成超3亿笔AI智能体支付。微信支付上线AI接入体系,字节豆包内测对话框直接下单支付。PayPal+OpenAI合作,全球AI支付竞赛打响。
中科院大连化物所研发全球首套智能透射电镜系统「原眼一号」,实现传样-成像-解析全流程无人化。日均分析168个样品,效率较人工提升300倍以上。
苹果发布PICO感知图像编解码器,通过AI训练优化人眼视觉体验,同等画质下文件体积仅为AV1等主流标准的1/3,并在iPhone上实现毫秒级实时编解码。