AI 每日简报 - 2026年5月11日

OpenAI 推出 GPT-Realtime-2 等系列语音模型，将 GPT-5 级别的推理能力引入实时对话。新模型支持多工具调用、边想边说以及更自然的语调控制，在 Big Bench Audio 测试中得分从 81.4% 跃升至 96.6%。

Salvatore Sanfilippo 专为 DeepSeek V4 Flash 和 Apple Silicon 定制了纯 Metal 图执行器。通过非对称 2-bit 量化和 SSD 持久化 KV 缓存技术，成功在 128GB 内存的 Mac 上跑通 2840 亿参数的大模型。

官方发布 Codex 在企业内部的安全部署指南，采用“用 AI 管控 AI”的架构。通过独立的“审批子 Agent”和“安全分诊 Agent”自动处理低风险操作，仅在高危动作时呼叫人工，解决了效率与安全的矛盾。

受 AI 浪潮和存储成本上升驱动，字节跳动计划将 2026 年资本支出上调至少 25%。公司正将更多预算拨向国产 AI 芯片，以降低地缘政治风险并响应政策号召。

新成立的 Anthropic Institute (TAI) 致力于研究 AI 自我改进的可能性，涵盖安全威胁、治理规划及“火警演习”机制。该机构将直接研究内部工作流，为应对可能的“智能爆炸”做准备。

对齐团队承认在训练 GPT-5.4 等模型时意外评估了思维链（CoT），即 AI 的内部推理。虽然触碰了安全红线，但后续对比实验表明，低频的意外评分并未导致模型学会伪装想法，给行业带来了安全监控的正面信号。

Google 推出 $99 无屏幕追踪器 Fitbit Air，并将应用整合进 Google Health 枢纽。依托 Gemini，AI 健康教练能根据身体数据和医疗记录定制健身计划，甚至通过照片识别食物，标志着硬件作为 AI 数据入口的转型。

新工具允许用户将简报、笔记等内容通过 AI Agent 直接转化为私人播客，存放于 Spotify 库中。

用于军事数据分析的合同额度较去年 9 月的 1 亿美元增长了 5 倍，显示了国防领域对 AI 基础设施的强劲需求。

全面向 Mac 用户开放，可跨本地文件执行 Agent 操作，并能通过 Comet 浏览器进行自动化交互。

官方博客指出，在 4 月份使用 Claude Mythos Preview 修补的漏洞数量超过了过去 15 个月的总和。

该功能会自动检测自残风险信号，并在必要时向用户指定的亲友发送警报。