百川Baichuan-M4横扫三大医疗榜单:3.3%幻觉率创全球新低,AI家庭医生来了
百川Baichuan-M4横扫三大医疗榜单,3.3%幻觉率全球新低,AI家庭医生百小医构建四级诊疗新范式
共 22 篇文章
百川Baichuan-M4横扫三大医疗榜单,3.3%幻觉率全球新低,AI家庭医生百小医构建四级诊疗新范式
DeepSWE新编程基准颠覆排行榜:GPT-5.5反超Claude Opus 4.7,旧榜单12%成绩涉作弊,验证器误差差一个数量级
Anthropic三大模型同日曝光:Opus 4.8现身Vertex后台、Sonnet跳级4.8、Mythos 1转商业化,IPO前夕全线出击
GPT-5.6在Codex后台泄露,150万Token上下文+极简UI突破,OpenAI迭代进入30天周期,6月三巨头混战在即
Anthropic联创Jack Clark预言2028年AI递归自我改进概率超60%,DeepMind CEO预测2030年AGI降临,冲击力为工业革命100倍。
Telegram Bot API 10.0上线Bot间对话功能,AI Agent获得原生通信层,多个Agent可组成协作网络,13万人围观。
谷歌AI Studio上线免费生成原生Android App功能,一周创建超25万个APP,99%创建者无开发经验,AI开发平民化加速。
腾讯应用宝上线免费AI应用"吐司",自然语言生成可下载APK,半天手搓四个APP,零代码开发时代来临。
小米MiMo-V2.5系列API永久降价最高99%,紧跟DeepSeek降价75%,大模型价格战白热化,调用量飙升5-8倍。
阿里通义千问Qwen3.7-Max在Code Arena编程专项排名闯入全球前二,前面只剩Claude,是中国大模型的历史性突破。