AI 每日简报 - 2026年5月11日

🗣️ OpenAI 发布 GPT-Realtime-2 等三款语音模型，推理能力大幅跃升

OpenAI 推出 GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper。其中 Realtime-2 具备 GPT-5 级别的推理能力，在 Big Bench Audio 测试中得分从 81.4% 跃升至 96.6%。新模型支持多工具调用、边思考边说话，并能精准控制语气，显著提升了语音智能体的实时交互体验。

🖱️ 微软开源 Phi-Ground：40 亿参数点击准度超越 OpenAI Operator

微软开源了专门用于操控电脑的 Phi-Ground 模型家族。通过大规模验证和创新的训练策略（如坐标直接作为数字输出、指令前置输入），40 亿参数版在多项基准测试中点击准确率超过了百亿参数模型及 OpenAI Operator。该模型还能通过 DPO 强化学习进一步提升纯感知任务的准确率。

⚡ Sakana AI 联合英伟达：跳过 80% 无效计算，H100 推理提速 30%

Sakana AI 联合英伟达开源 TwELL 稀疏数据格式。该技术利用大模型前馈层中 80% 神经元处于“休眠”状态的特性，通过针对 GPU 并行逻辑设计的小方块（tile）处理方式，成功跳过无效计算。实测显示 H100 推理提速达 30%，且模型准确率几乎无损。

🌐 Reactor 推出实时世界模型：云端加持实现 3D 场景即时生成

由前苹果及 Luma AI 核心成员创办的 Reactor 上线了实时世界模型。该模型能根据用户操作即时生成 3D 场景（如异星沙漠行驶），通过自建低延迟云节点解决了本地硬件门槛。Reactor 愿景是将视频转化为可编程、可互动的生成世界。

💰 DeepSeek 传获 500 亿人民币首轮融资，大厂与国家队联手注资

传 DeepSeek 首轮融资接近落定，阿里、腾讯、国家大基金各注资 100 亿，加之创始人注资，估值达 3500 亿。巨额资金将用于缓解算力危机并留住顶尖人才。公司正从纯研究向产品化转型，预计 6 月发布多模态 V4.1 模型。

📉 科技大厂财报预警：AI 推理成本正侵蚀裁员带来的“人力红利”

Shopify、Roblox 及 Spotify 在财报中指出，虽然 AI 减少了员工需求，但飙升的芯片投资和不可预测的 Token 消耗正压低毛利率。Roblox 已下调利润预期，并计划对高算力 AI 工具收费，“用算力换人力”的经济账正变得日益复杂。

⚖️ 庭审证据揭秘 Mira Murati 在 OpenAI 政变中的多面角色

马斯克诉 Altman 案证据显示，前 CTO Mira Murati 是推动解雇 Altman 的幕后主力，通过提供投诉清单和内部记录极大地影响了董事会。但在风向反转后，她又是第一个带头签名要求 Altman 复职的人。其在政变中的“精致利己”角色引发业界热议。

🎙️ 姚顺宇复盘：Claude 代码能力走强纯属“自下而上”的技术意外

前 Anthropic 研究员姚顺宇透露，Claude 3 代码能力的突破最初并非公司战略，而是源于某个团队的意外成果。看到市场反馈后公司才全力押注。他还认为 OpenAI 做不到这种快速决策是因为其内部权力结构的变动，而 Anthropic 的创始人团队在技术决策上更有权威。

🥊 杨立昆驳斥“硅谷领先论”：DeepSeek 等关键技术并非硅谷产物

图灵奖得主 Yann LeCun 公开反击硅谷领先全球的观点，指出 Attention 诞生于蒙特利尔、AlphaGo 诞生于伦敦、DeepSeek 诞生于杭州。他认为硅谷仅在特定话题上保持领先，核心创新实际上分布全球。

🚫 OpenAI 将关停自助微调 API，开发者被引导向 Prompt 与 RAG

OpenAI 宣布将全面关停面向开发者的自助微调服务，新用户已无法创建任务。OpenAI 认为新模型在遵循指令上已足够强大，建议使用 Prompt 工程。这增加了初创团队通过微调建立技术壁垒的难度。

🛍️ 淘宝与千问大模型全面打通，支持一句话比价、凑单与下单

阿里巴巴宣布千问 App 接入淘宝 40 亿商品库，上线 AI 购物助手。用户可通过对话实现精准搜货、自动化凑单算账、外部种草贴找同款及 AI 试穿等功能。

💸 OpenAI 内部造富：超 600 名员工套现 66 亿美元

《华尔街日报》披露 OpenAI 内部股票交易规模，员工套现总额达 66 亿美元，其中 75 人拿满 3000 万美元上限。这种 IPO 前的大规模套现让大批员工提前实现财富自由。

📉 算力成本神话：DeepSeek V4 凭借极高缓存命中率实现“Token 自由”

开发者发现利用 DeepSeek V4 Pro 极高的缓存命中率，处理数千万 Token 的成本仅为几元人民币，远低于 Claude 等竞品。这种“价格屠夫”策略正吸引大量全自动编程流量。

🛡️ 安全漏洞：新华三灵犀助手明文暴露云端 API 凭据长达 3 个月

号称基于本地运行的新华三“灵犀 AI 助手”被曝在安装程序中明文写入智谱、百度等云端 API 密钥。官方在漏洞上报 3 个月后才完成吊销。