每日 AI 新闻简报

时间窗口：过去 24 小时主来源：Telegram / OneMillion_AI 已按突破 / 观察 / 快讯分类

过去 24 小时内，AI 产品、代理框架、设计即代码、实时语音交互与评测体系成为主线；xAI、OpenAI、腾讯、阿里云、Perplexity 等均有密集动作。

突破

优先关注可能改变产品形态或工作流的进展。

突破

Hermes v0.14：原生接入 Grok，订阅能力进一步代理化

动察Beating AI News · 2026-05-18 10:49 CST

NousResearch 发布 Hermes Agent v0.14.0，合入 800+ 提交，核心是把 xAI 体系提升为原生能力，并支持 SuperGrok 订阅直接调用。

这意味着“会员订阅 → 智能体可用算力”的路径更短，面向本地智能体的接入门槛继续下降。

来源：Telegram OneMillion_AI / 原文时间：2026-05-18T02:49:03+00:00

突破

腾讯公测 AI 设计智能体 Ardot：MCP 直连 IDE，支持私有组件库

动察Beating AI News · 2026-05-18 11:34 CST

Ardot 将设计稿转为结构化数据，再通过 MCP 连接外部 IDE，支持自然语言批量生成与修改界面，并可接入企业私有组件库。

如果落地稳定，设计到研发的交付链路会明显缩短。

来源：Telegram OneMillion_AI / 原文时间：2026-05-18T03:34:30+00:00

突破

OpenAI 为 Codex 测试实时语音模式，前台对话与后台执行切分

动察Beating AI News · 2026-05-18 15:14 CST

泄露代码显示，Codex 正在内测实时语音能力，用户可用语音下达复杂指令，前台继续交流，后台并行执行任务。

这类“双线并行”设计有望改善当前 AI 编程助手最明显的交互阻塞问题。

来源：Telegram OneMillion_AI / 原文时间：2026-05-18T07:14:28+00:00

突破

Perplexity 测试个人 CFO 面板，想做轻量版金融工作台

动察Beating AI News · 2026-05-18 16:55 CST

曝光截图显示，Perplexity 正在测试汇聚投资组合、交易记录、负债管理与第三方金融数据的 “Personal CFO” 页面。

若继续推进，它会从通用搜索向个人财务终端再走一步。

来源：Telegram OneMillion_AI / 原文时间：2026-05-18T08:55:46+00:00

突破

阿里云 QoderWork 上线语音设计工作台

动察Beating AI News · 2026-05-18 17:13 CST

Design Desk 允许用户直接语音输入需求，系统在画布上生成可运行设计，并支持导出为 React + Vite 工程。

这代表“说需求 → 出可跑网页”的路径进一步产品化。

来源：Telegram OneMillion_AI / 原文时间：2026-05-18T09:13:57+00:00

观察

更偏趋势、效率提升与行业压力测试。

观察

xAI 把 SuperGrok Heavy 价格从 300 美元/月直降到 99 美元/月

动察Beating AI News · 2026-05-18 11:09 CST

xAI 用大幅折扣推动高阶订阅扩张，同时把 Grok Build 这类开发工具的门槛继续下压。

价格战的信号很明确：顶级模型能力正在更快向订阅层下放。

来源：Telegram OneMillion_AI / 原文时间：2026-05-18T03:09:23+00:00

观察

Citadel 直言内部 AI 已把金融 PhD 数月投研压缩到数小时

动察Beating AI News · 2026-05-18 11:57 CST

Ken Griffin 公开表示，高级投研工作正被内部 AI 智能体快速自动化，过去需要数周甚至数月的流程被压缩到几小时或几天。

对高智力岗位的替代速度，正在向金融核心环节渗透。

来源：Telegram OneMillion_AI / 原文时间：2026-05-18T03:57:46+00:00

观察

腾讯测试“狍子 AI”，把公众号文章直接转成个人知识库

动察Beating AI News · 2026-05-18 12:22 CST

用户可把微信公众号文章一键导入知识库，通过账号绑定和转发完成入库。

这类产品的关键不在“能不能存”，而在“能不能检索、问答和持续复用”。

来源：Telegram OneMillion_AI / 原文时间：2026-05-18T04:22:21+00:00

观察

TERMS-Bench 发布：把 AI 谈判能力变成更透明的压力测试

动察Beating AI News · 2026-05-18 14:36 CST

斯坦福团队推出经济谈判测试集，直接暴露模型在出价、让步与违规上的真实表现。

这类评测更像“博弈场景模拟器”，能帮助理解模型在真实商业互动中的风险边界。

来源：Telegram OneMillion_AI / 原文时间：2026-05-18T06:36:39+00:00

观察

“去深圳做硬件”再被强调：AI 硬件创业仍离不开供应链密度

动察Beating AI News · 2026-05-18 14:03 CST

前 SpaceX 工程师 Zac Valles 强调，硬件创业者应尽早飞深圳，在样机、打样和供应链协同上获得速度优势。

虽然不是纯软件 AI 新闻，但它反映了 AI 终端与硬件生态的现实约束。

来源：Telegram OneMillion_AI / 原文时间：2026-05-18T06:03:17+00:00

观察

独立研究机构警告：盲目押注 AI 算力瓶颈，风险正在放大

动察Beating AI News · 2026-05-18 15:58 CST

Citrini Research 指出，AI 价值链的真实流向依旧不清晰，在没有想明白终局结构前重仓算力，风险很高。

这更像是对二级市场“单边叙事”的一次降温提醒。

来源：Telegram OneMillion_AI / 原文时间：2026-05-18T07:58:06+00:00

观察

DeepMind 研究员离职，直指评测系统已成能力跃升瓶颈

动察Beating AI News · 2026-05-18 16:21 CST

Lun Wang 认为，现有评测只能测试模型“已知会什么”，却难以跟上下一代模型突然涌现的新能力。

如果这判断成立，行业下一阶段的重要课题不只是训练，更是如何评估与验证。

来源：Telegram OneMillion_AI / 原文时间：2026-05-18T08:21:01+00:00

快讯

短平快更新，含未确认传闻与边际消息。

快讯

Gemini 3.2 实时模型在谷歌云控制台现身

动察Beating AI News · 2026-05-18 09:28 CST

模型条目带有 lite 与 live 后缀，指向更低延迟的实时交互版本。

这类“控制台抢跑”通常意味着后续产品化动作值得继续盯。

来源：Telegram OneMillion_AI / 原文时间：2026-05-17T01:28:26+00:00

快讯

Claude Mythos 去掉预览标签，疑似即将公测

动察Beating AI News · 2026-05-18 09:17 CST

谷歌云控制台中出现的 Claude Mythos 条目已不再标注“预览”，与此前 Claude Opus 4.7 的路径相似。

目前仍属迹象层面，尚未见官方正式发布。

来源：Telegram OneMillion_AI / 原文时间：2026-05-17T01:17:51+00:00

快讯

GPT-5.6 / Sonnet 5 / Gemini 3.5 “本周齐发”说法未获证实

动察Beating AI News · 2026-05-18 15:42 CST

相关爆料账号过往有夸大记录，当前仅能视为社媒传闻，未见可靠证据支持。

已按未确认信息处理，不作为确定新闻。

来源：Telegram OneMillion_AI / 原文时间：2026-05-18T07:42:40+00:00

快讯

OpenAI / xAI / 腾讯 / 阿里云动作密集，产品化节奏继续加快

动察Beating AI News · 2026-05-18 晚间汇总

从编程代理、语音交互、设计即代码到知识库产品，今天的更新几乎都在把 AI 从“聊天”推向“执行”。

短期看，产品形态变化比模型参数更值得关注。

汇总：基于 OneMillion_AI 最近 24 小时消息