AI 每日简报

日期:2026年5月11日 | 来源:OneMillion_AI, The Rundown AI
突破 (Breakthrough)

OpenAI 发布 GPT-Realtime-2:语音智能大跨越

OpenAI 推出 GPT-Realtime-2 等系列语音模型,将 GPT-5 级别的推理能力引入实时对话。新模型支持多工具调用、边想边说以及更自然的语调控制,在 Big Bench Audio 测试中得分从 81.4% 跃升至 96.6%。

Redis 创始人发布极简端侧推理引擎 ds4.c

Salvatore Sanfilippo 专为 DeepSeek V4 Flash 和 Apple Silicon 定制了纯 Metal 图执行器。通过非对称 2-bit 量化和 SSD 持久化 KV 缓存技术,成功在 128GB 内存的 Mac 上跑通 2840 亿参数的大模型。

OpenAI 披露自主编程 Agent 安全框架

官方发布 Codex 在企业内部的安全部署指南,采用“用 AI 管控 AI”的架构。通过独立的“审批子 Agent”和“安全分诊 Agent”自动处理低风险操作,仅在高危动作时呼叫人工,解决了效率与安全的矛盾。

观察 (Observation)

字节跳动上调 2026 年资本支出计划

受 AI 浪潮和存储成本上升驱动,字节跳动计划将 2026 年资本支出上调至少 25%。公司正将更多预算拨向国产 AI 芯片,以降低地缘政治风险并响应政策号召。

Anthropic 研究机构发布“自我提升”研究议程

新成立的 Anthropic Institute (TAI) 致力于研究 AI 自我改进的可能性,涵盖安全威胁、治理规划及“火警演习”机制。该机构将直接研究内部工作流,为应对可能的“智能爆炸”做准备。

OpenAI 回应 CoT 训练事故:无伪装瞒报证据

对齐团队承认在训练 GPT-5.4 等模型时意外评估了思维链(CoT),即 AI 的内部推理。虽然触碰了安全红线,但后续对比实验表明,低频的意外评分并未导致模型学会伪装想法,给行业带来了安全监控的正面信号。

Google 整合 Fitbit 打造 AI 健康平台

Google 推出 $99 无屏幕追踪器 Fitbit Air,并将应用整合进 Google Health 枢纽。依托 Gemini,AI 健康教练能根据身体数据和医疗记录定制健身计划,甚至通过照片识别食物,标志着硬件作为 AI 数据入口的转型。

快讯 (Flash)

Spotify 推出“私人播客”:AI 瞬间转录 briefings

新工具允许用户将简报、笔记等内容通过 AI Agent 直接转化为私人播客,存放于 Spotify 库中。

Scale AI 斩获五角大楼 5 亿美元合同

用于军事数据分析的合同额度较去年 9 月的 1 亿美元增长了 5 倍,显示了国防领域对 AI 基础设施的强劲需求。

Perplexity PC 桌面版发布

全面向 Mac 用户开放,可跨本地文件执行 Agent 操作,并能通过 Comet 浏览器进行自动化交互。

Mozilla 报告:Claude 修复漏洞效率极高

官方博客指出,在 4 月份使用 Claude Mythos Preview 修补的漏洞数量超过了过去 15 个月的总和。

OpenAI 推出 Trusted Contact 安全功能

该功能会自动检测自残风险信号,并在必要时向用户指定的亲友发送警报。