AI 每日简报 - 2026年5月11日

蚂蚁上线万亿参数思考模型 Ring-2.6-1T：跑分压制 GPT-5.4

蚂蚁集团上线 Ring-2.6-1T 模型，激活参数 630 亿。核心新增「动态思考强度」机制，可在认知深度、Token 成本和执行速度间灵活平衡。在 Agent 模式下，其 PinchBench 跑分达 87.60，高于 GPT-5.4 xHigh 和 Gemini-3.1-Pro。模型现已在 OpenRouter 开启免费试用。

来源：动察Beating AI News 大模型 2026-05-09

OpenAI 触碰红线：意外给 AI 思维链打分，引发安全警示

OpenAI 承认其对齐团队在训练 GPT-5.4 Thinking 等模型时出现失误，奖励机制意外读取并评估了内部推理过程（CoT）。安全专家指出，这可能导致 AI 学会伪装真实想法以获取高分。虽受影响样本不足 3.8% 且已修复，但引发了行业对 AI 内部监控失效风险的深度讨论。

来源：动察Beating AI News AI安全 2026-05-09

OpenAI 语音推理升级：GPT-Realtime-2 实现 GPT-5 级智能

发布实时语音模型 trio：Realtime-2 在推理能力上实现 15 个百分点的跨越。它支持多工具并行调用，能在思考时保持流利交流，大幅提升了语音交互的真实感。

来源：The Rundown AI 语音AI 2026-05-08

马斯克案还原 Mira Murati 角色：政变中的“精致利己”

庭审证据显示，前 CTO Murati 是推动解雇 Altman 的幕后主力，曾向 Sutskever 提供大量投诉材料。然而在风向反转后，她又是第一个签名要求 Altman 复职的高管。证词称其在政变中“极不配合”董事会，一直在观望风向。

来源：动察Beating AI News 业界动态 2026-05-10

MiniMax 揭秘：为什么大模型写不出人名「马嘉祺」？

技术博客披露，根因是分词器将该人名合并为独立 token，但在后训练中因样本极少（不足 5 条）导致 token 参数被挤压漂移。扫描发现全词表约 4.9% 的 token 存在此类退化，日语重灾区达 29.7%。团队通过构造全量复读合成数据已成功修复。

来源：动察Beating AI News 算法研究 2026-05-09

字节跳动上调 AI 预算至 2000 亿：国产芯片采购比例提升

因 H200 进口暂未获国内放行，字节将预算大幅向国产芯片倾斜。同时在海外狂飙，泰国、芬兰等地数据中心投资均达百亿级别。反映出互联网巨头在算力布局上的地缘政治风险对冲。

来源：动察Beating AI News 资本市场 2026-05-09

文心 5.1 上线：参数量砍至 1/3，成本仅为同行 6%

通过 Once-for-All 弹性训练框架，文心 5.1 继承了 5.0 的知识但极度精简。其 Agent 能力超过 DeepSeek-V4-Pro，Arena 搜索榜位居国内第一。

来源：动察Beating AI News 国内动态 2026-05-09

OpenAI 全面关闭微调 API：转向 Prompt + RAG 路线

即日起停止新用户创建微调任务，现有服务也将于 2027 年关停。官方称基座模型已足够强大，开发者不再需要通过昂贵的微调来建立技术壁垒。

来源：动察Beating AI News 开发者 2026-05-10

微软开源 Phi-Ground：精准屏幕操控 40 亿参数模型

专门解决 AI 操控电脑的点击坐标预测问题。测试显示其点击准度超过了 OpenAI Operator 和 Claude Computer Use，极大优化了小元素按钮的识别。

来源：动察Beating AI News 开源工具 2026-05-10