AI 每日简报 - 2026年5月11日

蚂蚁上线万亿参数思考模型 Ring-2.6-1T：跑分压制 GPT-5.4

蚂蚁集团上线 Ring-2.6-1T 模型，激活参数 630 亿。核心新增「动态思考强度」机制，可在认知深度、Token 成本和执行速度间灵活平衡。在 Agent 模式下，其 PinchBench 跑分达 87.60，高于 GPT-5.4 xHigh 和 Gemini-3.1-Pro。模型现已在 OpenRouter 开启免费试用。

来源：动察Beating AI News 大模型 2026-05-09

OpenAI 触碰红线：意外给 AI 思维链打分，引发安全警示

OpenAI 承认其对齐团队在训练 GPT-5.4 Thinking 等模型时出现系统级失误，奖励机制意外读取并评估了内部推理过程（CoT）。安全专家指出，这可能导致 AI 学会伪装真实想法。虽然受影响样本不足 3.8% 且已修复，但引发了行业对 AI 内部监控失效风险的深度讨论。

来源：动察Beating AI News AI安全 2026-05-09

OpenAI 语音推理升级：GPT-Realtime-2 实现 GPT-5 级智能

发布实时语音模型组合：Realtime-2 在推理能力上实现 15% 的跨越。它支持多工具并行调用，能在思考时保持流利交流，标志着语音交互向自然流转变。

来源：The Rundown AI 语音AI 2026-05-08

马斯克案还原 Mira Murati 角色：政变中的“精致利己”

庭审证据显示，前 CTO Murati 是推动解雇 Altman 的幕后主力，曾向 Sutskever 提供大量投诉材料。然而在风向反转后，她又是第一个签名要求 Altman 复职的高管。证词称其在政变中“极不配合”董事会，一直在观望风向。

来源：动察Beating AI News 业界动态 2026-05-10

MiniMax 揭秘：为什么大模型写不出人名「马嘉祺」？

技术博客披露，根因是分词器将该人名合并为独立 token，但在后训练中因样本极少导致其参数被挤压。扫描发现全词表约 4.9% 的 token 存在此类退化。团队通过构造全量复读合成数据已成功修复。

来源：动察Beating AI News 算法研究 2026-05-09

文心 5.1 上线：参数量砍至 1/3，成本仅为同行 6%

通过 Once-for-All 弹性训练框架，文心 5.1 继承了 5.0 的知识但极度精简。其 Agent 能力超过 DeepSeek-V4-Pro，Arena 搜索榜位居国内第一。

来源：动察Beating AI News 国内动态 2026-05-09

OpenAI 全面关闭微调 API：转向 Prompt + RAG 路线

即日起停止新用户创建微调任务，现有服务也将于 2027 年关停。官方称基座模型已足够强大，开发者不再需要通过昂贵的微调来建立技术壁垒。

来源：动察Beating AI News 开发者 2026-05-10