AI 每日简报

日期：2026年5月11日 | 来源：OneMillion_AI, The Rundown AI

突破 Breakthrough

推出三款 API 语音模型（Realtime-2, Translate, Whisper），带来 GPT-5 级别的推理能力。在 Big Bench Audio 测试中得分从 81.4% 跃升至 96.6%，支持实时工具调用与更拟人的语调控制。

通过多层 Agent 架构（协调、检索、推理、审稿），DeepMind 在研究级数学基准 FrontierMath Tier 4 上拿下 47.9% 正确率，解出 3 道此前无模型能解的难题，远超 GPT-5.5 Pro。

Tilde Research 发现热门优化器 Muon 会导致 MLP 层超 1/4 神经元死亡。新推出的 Aurora 在保持正交性的同时确保更新均匀，1.1B 模型仅用 100B token 即逼平 Qwen3-1.7B (36T token)。

开源 TwELL 稀疏格式，让 H100 推理提速 30%，训练提速 24%。利用大模型 FFN 层中大量“休眠神经元”的特性，针对 GPU 并行逻辑优化，大幅降低显存开销。

观察 Observation

由于内存成本上涨及业务扩张，字节今年资本支出增幅超 25%。受地缘政治及政策影响，预算重心正大幅转向国产 AI 芯片，规避英伟达 H200 准入限制风险。

马斯克诉 Altman 案证据显示，Murati 是推动解雇的主力（曾递交投诉清单并协助 Sutskever），但在风向反转后又是第一个联名要求 Altman 复职的高管。

官方邮件确认将全面停止自助微调服务，理由是新一代基座模型指令遵循能力已足够强大。此举引发初创团队担忧，因为利用微调构建行业壁垒的路径被收窄。

传闻公司估值达 3500 亿人民币。此轮融资旨在应对人才流失（如郭达雅离职）与高端算力采购需求，DeepSeek 正从纯研究机构转向商业实战。

新成立的研究机构发布议程，重点研究 AI 系统自我完善的可能性，提议实验室间建立“冷战式红线”与“紧急演习”机制，以应对可能的智力爆炸。

快讯 Flash

antirez 发布专为 Apple Silicon 定制的极简引擎，通过 2-bit 非对称量化与 KV 缓存持久化，在个人设备上压榨出极限推理性能。

千问 App 接入淘宝 40 亿商品库，支持一句话下单、比价、凑单、售后及 AI 试穿。中美电商 AI 落地路线出现分化，阿里更倾向于全链路自动化。

专门解决智能体操作电脑的坐标预测问题。测试显示坐标直接输出数字的效果优于位置词汇表，准确率在同规模模型中排名第一。

内部股票交易允许员工每人最高出售 3000 万美元股份。75 人拿到顶格额度，总裁 Brockman 持股价值约达 300 亿美元。

用于军事数据分析。这一合同规模较去年 9 月增长了 5 倍，显示出军方对 AI 基础设施的投入正在激增。