AI 每日简报

2026年5月11日 | 来源: OneMillion_AI, The Rundown AI
突破 Breakthrough
🗣️ OpenAI 发布 GPT-Realtime-2 等三款语音模型,推理能力大幅跃升
OpenAI 推出 GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper。其中 Realtime-2 具备 GPT-5 级别的推理能力,在 Big Bench Audio 测试中得分从 81.4% 跃升至 96.6%。新模型支持多工具调用、边思考边说话,并能精准控制语气,显著提升了语音智能体的实时交互体验。
🖱️ 微软开源 Phi-Ground:40 亿参数点击准度超越 OpenAI Operator
微软开源了专门用于操控电脑的 Phi-Ground 模型家族。通过大规模验证和创新的训练策略(如坐标直接作为数字输出、指令前置输入),40 亿参数版在多项基准测试中点击准确率超过了百亿参数模型及 OpenAI Operator。该模型还能通过 DPO 强化学习进一步提升纯感知任务的准确率。
⚡ Sakana AI 联合英伟达:跳过 80% 无效计算,H100 推理提速 30%
Sakana AI 联合英伟达开源 TwELL 稀疏数据格式。该技术利用大模型前馈层中 80% 神经元处于“休眠”状态的特性,通过针对 GPU 并行逻辑设计的小方块(tile)处理方式,成功跳过无效计算。实测显示 H100 推理提速达 30%,且模型准确率几乎无损。
🌐 Reactor 推出实时世界模型:云端加持实现 3D 场景即时生成
由前苹果及 Luma AI 核心成员创办的 Reactor 上线了实时世界模型。该模型能根据用户操作即时生成 3D 场景(如异星沙漠行驶),通过自建低延迟云节点解决了本地硬件门槛。Reactor 愿景是将视频转化为可编程、可互动的生成世界。
观察 Observation
💰 DeepSeek 传获 500 亿人民币首轮融资,大厂与国家队联手注资
传 DeepSeek 首轮融资接近落定,阿里、腾讯、国家大基金各注资 100 亿,加之创始人注资,估值达 3500 亿。巨额资金将用于缓解算力危机并留住顶尖人才。公司正从纯研究向产品化转型,预计 6 月发布多模态 V4.1 模型。
📉 科技大厂财报预警:AI 推理成本正侵蚀裁员带来的“人力红利”
Shopify、Roblox 及 Spotify 在财报中指出,虽然 AI 减少了员工需求,但飙升的芯片投资和不可预测的 Token 消耗正压低毛利率。Roblox 已下调利润预期,并计划对高算力 AI 工具收费,“用算力换人力”的经济账正变得日益复杂。
⚖️ 庭审证据揭秘 Mira Murati 在 OpenAI 政变中的多面角色
马斯克诉 Altman 案证据显示,前 CTO Mira Murati 是推动解雇 Altman 的幕后主力,通过提供投诉清单和内部记录极大地影响了董事会。但在风向反转后,她又是第一个带头签名要求 Altman 复职的人。其在政变中的“精致利己”角色引发业界热议。
🎙️ 姚顺宇复盘:Claude 代码能力走强纯属“自下而上”的技术意外
前 Anthropic 研究员姚顺宇透露,Claude 3 代码能力的突破最初并非公司战略,而是源于某个团队的意外成果。看到市场反馈后公司才全力押注。他还认为 OpenAI 做不到这种快速决策是因为其内部权力结构的变动,而 Anthropic 的创始人团队在技术决策上更有权威。
🥊 杨立昆驳斥“硅谷领先论”:DeepSeek 等关键技术并非硅谷产物
图灵奖得主 Yann LeCun 公开反击硅谷领先全球的观点,指出 Attention 诞生于蒙特利尔、AlphaGo 诞生于伦敦、DeepSeek 诞生于杭州。他认为硅谷仅在特定话题上保持领先,核心创新实际上分布全球。
快讯 Flash
🚫 OpenAI 将关停自助微调 API,开发者被引导向 Prompt 与 RAG
OpenAI 宣布将全面关停面向开发者的自助微调服务,新用户已无法创建任务。OpenAI 认为新模型在遵循指令上已足够强大,建议使用 Prompt 工程。这增加了初创团队通过微调建立技术壁垒的难度。
🛍️ 淘宝与千问大模型全面打通,支持一句话比价、凑单与下单
阿里巴巴宣布千问 App 接入淘宝 40 亿商品库,上线 AI 购物助手。用户可通过对话实现精准搜货、自动化凑单算账、外部种草贴找同款及 AI 试穿等功能。
💸 OpenAI 内部造富:超 600 名员工套现 66 亿美元
《华尔街日报》披露 OpenAI 内部股票交易规模,员工套现总额达 66 亿美元,其中 75 人拿满 3000 万美元上限。这种 IPO 前的大规模套现让大批员工提前实现财富自由。
📉 算力成本神话:DeepSeek V4 凭借极高缓存命中率实现“Token 自由”
开发者发现利用 DeepSeek V4 Pro 极高的缓存命中率,处理数千万 Token 的成本仅为几元人民币,远低于 Claude 等竞品。这种“价格屠夫”策略正吸引大量全自动编程流量。
🛡️ 安全漏洞:新华三灵犀助手明文暴露云端 API 凭据长达 3 个月
号称基于本地运行的新华三“灵犀 AI 助手”被曝在安装程序中明文写入智谱、百度等云端 API 密钥。官方在漏洞上报 3 个月后才完成吊销。