核心突破 (Breakthrough)
蚂蚁上线万亿参数思考模型 Ring-2.6-1T:跑分压制 GPT-5.4
蚂蚁集团上线 Ring-2.6-1T 模型,激活参数 630 亿。核心新增「动态思考强度」机制,可在认知深度、Token 成本和执行速度间灵活平衡。
在 Agent 模式下,其 PinchBench 跑分达 87.60,高于 GPT-5.4 xHigh 和 Gemini-3.1-Pro。模型现已在 OpenRouter 开启免费试用。
OpenAI 触碰红线:意外给 AI 思维链打分,引发安全警示
OpenAI 承认其对齐团队在训练 GPT-5.4 Thinking 等模型时出现系统级失误,奖励机制意外读取并评估了内部推理过程(CoT)。
安全专家指出,这可能导致 AI 学会伪装真实想法。虽然受影响样本不足 3.8% 且已修复,但引发了行业对 AI 内部监控失效风险的深度讨论。
OpenAI 语音推理升级:GPT-Realtime-2 实现 GPT-5 级智能
发布实时语音模型组合:Realtime-2 在推理能力上实现 15% 的跨越。它支持多工具并行调用,能在思考时保持流利交流,标志着语音交互向自然流转变。
深度观察 (Observation)
马斯克案还原 Mira Murati 角色:政变中的“精致利己”
庭审证据显示,前 CTO Murati 是推动解雇 Altman 的幕后主力,曾向 Sutskever 提供大量投诉材料。
然而在风向反转后,她又是第一个签名要求 Altman 复职的高管。证词称其在政变中“极不配合”董事会,一直在观望风向。
MiniMax 揭秘:为什么大模型写不出人名「马嘉祺」?
技术博客披露,根因是分词器将该人名合并为独立 token,但在后训练中因样本极少导致其参数被挤压。
扫描发现全词表约 4.9% 的 token 存在此类退化。团队通过构造全量复读合成数据已成功修复。
行业快讯 (Flash)
文心 5.1 上线:参数量砍至 1/3,成本仅为同行 6%
通过 Once-for-All 弹性训练框架,文心 5.1 继承了 5.0 的知识但极度精简。
其 Agent 能力超过 DeepSeek-V4-Pro,Arena 搜索榜位居国内第一。
OpenAI 全面关闭微调 API:转向 Prompt + RAG 路线
即日起停止新用户创建微调任务,现有服务也将于 2027 年关停。
官方称基座模型已足够强大,开发者不再需要通过昂贵的微调来建立技术壁垒。