突破
30B 开源模型 SU-01 靠长考把 IMO 题硬抬上金牌线
上海 AI Lab 等开源奥赛推理模型,单题可写到 10 万 token,不依赖工具完成长链推理。
上海 AI Lab 等开源奥赛推理模型,单题可写到 10 万 token,不依赖工具完成长链推理。
Codex 相关能力继续外延,目标是突破苹果锁屏限制,实现远程控制待机 Mac。
Copilot 从插件走向独立应用,结合 worktree、分支与 Agent Merge 形成并行开发闭环。
长上下文预训练机制开源,主打先粗筛再精算,在 98K 长度下也给出 1.4–1.7 倍训练提速。
研究型 checkpoint 走连续潜在扩散路线,尝试绕开传统 token 自回归生成范式。
Google Cloud 控制台里模型已去掉预览标记,外界普遍预期其即将放量。
Mistral 强调欧洲本土独立路线,并声称有能力挖出同等级别的安全漏洞。
The Atlantic 与民调显示,AI 智能体越界行为正在放大全社会的反感与疲劳。
AI 造富效应加剧职业焦虑,中层、年轻工程师与暴富群体都在重估路径。
Opus 4.6/4.7 已把数学与综合得分差距压到 1 分以内,模型偏科明显缓解。
开源智能体新增推文搜索能力,第三方订阅接入继续扩展。
官方确认已定位并修复两项隐患,同时重置用户用量限制。
xAI 公开内部版本差异,称新一代基础模型在数据与规模上将全面升级。
编辑器开始直接吃订阅额度,减少 API 按量计费摩擦。
AI 辅助安全研究再现突破,证明顶级模型能显著缩短漏洞利用链构建时间。