AI DAILY BRIEFING

每日 AI 新闻简报

时间窗口:过去 24 小时 主来源:Telegram / OneMillion_AI 已按突破 / 观察 / 快讯 分类
过去 24 小时内,AI 产品、代理框架、设计即代码、实时语音交互与评测体系成为主线;xAI、OpenAI、腾讯、阿里云、Perplexity 等均有密集动作。

突破

优先关注可能改变产品形态或工作流的进展。
突破

Hermes v0.14:原生接入 Grok,订阅能力进一步代理化

动察Beating AI News · 2026-05-18 10:49 CST

NousResearch 发布 Hermes Agent v0.14.0,合入 800+ 提交,核心是把 xAI 体系提升为原生能力,并支持 SuperGrok 订阅直接调用。

这意味着“会员订阅 → 智能体可用算力”的路径更短,面向本地智能体的接入门槛继续下降。

来源:Telegram OneMillion_AI / 原文时间:2026-05-18T02:49:03+00:00
突破

腾讯公测 AI 设计智能体 Ardot:MCP 直连 IDE,支持私有组件库

动察Beating AI News · 2026-05-18 11:34 CST

Ardot 将设计稿转为结构化数据,再通过 MCP 连接外部 IDE,支持自然语言批量生成与修改界面,并可接入企业私有组件库。

如果落地稳定,设计到研发的交付链路会明显缩短。

来源:Telegram OneMillion_AI / 原文时间:2026-05-18T03:34:30+00:00
突破

OpenAI 为 Codex 测试实时语音模式,前台对话与后台执行切分

动察Beating AI News · 2026-05-18 15:14 CST

泄露代码显示,Codex 正在内测实时语音能力,用户可用语音下达复杂指令,前台继续交流,后台并行执行任务。

这类“双线并行”设计有望改善当前 AI 编程助手最明显的交互阻塞问题。

来源:Telegram OneMillion_AI / 原文时间:2026-05-18T07:14:28+00:00
突破

Perplexity 测试个人 CFO 面板,想做轻量版金融工作台

动察Beating AI News · 2026-05-18 16:55 CST

曝光截图显示,Perplexity 正在测试汇聚投资组合、交易记录、负债管理与第三方金融数据的 “Personal CFO” 页面。

若继续推进,它会从通用搜索向个人财务终端再走一步。

来源:Telegram OneMillion_AI / 原文时间:2026-05-18T08:55:46+00:00
突破

阿里云 QoderWork 上线语音设计工作台

动察Beating AI News · 2026-05-18 17:13 CST

Design Desk 允许用户直接语音输入需求,系统在画布上生成可运行设计,并支持导出为 React + Vite 工程。

这代表“说需求 → 出可跑网页”的路径进一步产品化。

来源:Telegram OneMillion_AI / 原文时间:2026-05-18T09:13:57+00:00

观察

更偏趋势、效率提升与行业压力测试。
观察

xAI 把 SuperGrok Heavy 价格从 300 美元/月直降到 99 美元/月

动察Beating AI News · 2026-05-18 11:09 CST

xAI 用大幅折扣推动高阶订阅扩张,同时把 Grok Build 这类开发工具的门槛继续下压。

价格战的信号很明确:顶级模型能力正在更快向订阅层下放。

来源:Telegram OneMillion_AI / 原文时间:2026-05-18T03:09:23+00:00
观察

Citadel 直言内部 AI 已把金融 PhD 数月投研压缩到数小时

动察Beating AI News · 2026-05-18 11:57 CST

Ken Griffin 公开表示,高级投研工作正被内部 AI 智能体快速自动化,过去需要数周甚至数月的流程被压缩到几小时或几天。

对高智力岗位的替代速度,正在向金融核心环节渗透。

来源:Telegram OneMillion_AI / 原文时间:2026-05-18T03:57:46+00:00
观察

腾讯测试“狍子 AI”,把公众号文章直接转成个人知识库

动察Beating AI News · 2026-05-18 12:22 CST

用户可把微信公众号文章一键导入知识库,通过账号绑定和转发完成入库。

这类产品的关键不在“能不能存”,而在“能不能检索、问答和持续复用”。

来源:Telegram OneMillion_AI / 原文时间:2026-05-18T04:22:21+00:00
观察

TERMS-Bench 发布:把 AI 谈判能力变成更透明的压力测试

动察Beating AI News · 2026-05-18 14:36 CST

斯坦福团队推出经济谈判测试集,直接暴露模型在出价、让步与违规上的真实表现。

这类评测更像“博弈场景模拟器”,能帮助理解模型在真实商业互动中的风险边界。

来源:Telegram OneMillion_AI / 原文时间:2026-05-18T06:36:39+00:00
观察

“去深圳做硬件”再被强调:AI 硬件创业仍离不开供应链密度

动察Beating AI News · 2026-05-18 14:03 CST

前 SpaceX 工程师 Zac Valles 强调,硬件创业者应尽早飞深圳,在样机、打样和供应链协同上获得速度优势。

虽然不是纯软件 AI 新闻,但它反映了 AI 终端与硬件生态的现实约束。

来源:Telegram OneMillion_AI / 原文时间:2026-05-18T06:03:17+00:00
观察

独立研究机构警告:盲目押注 AI 算力瓶颈,风险正在放大

动察Beating AI News · 2026-05-18 15:58 CST

Citrini Research 指出,AI 价值链的真实流向依旧不清晰,在没有想明白终局结构前重仓算力,风险很高。

这更像是对二级市场“单边叙事”的一次降温提醒。

来源:Telegram OneMillion_AI / 原文时间:2026-05-18T07:58:06+00:00
观察

DeepMind 研究员离职,直指评测系统已成能力跃升瓶颈

动察Beating AI News · 2026-05-18 16:21 CST

Lun Wang 认为,现有评测只能测试模型“已知会什么”,却难以跟上下一代模型突然涌现的新能力。

如果这判断成立,行业下一阶段的重要课题不只是训练,更是如何评估与验证。

来源:Telegram OneMillion_AI / 原文时间:2026-05-18T08:21:01+00:00

快讯

短平快更新,含未确认传闻与边际消息。
快讯

Gemini 3.2 实时模型在谷歌云控制台现身

动察Beating AI News · 2026-05-18 09:28 CST

模型条目带有 lite 与 live 后缀,指向更低延迟的实时交互版本。

这类“控制台抢跑”通常意味着后续产品化动作值得继续盯。

来源:Telegram OneMillion_AI / 原文时间:2026-05-17T01:28:26+00:00
快讯

Claude Mythos 去掉预览标签,疑似即将公测

动察Beating AI News · 2026-05-18 09:17 CST

谷歌云控制台中出现的 Claude Mythos 条目已不再标注“预览”,与此前 Claude Opus 4.7 的路径相似。

目前仍属迹象层面,尚未见官方正式发布。

来源:Telegram OneMillion_AI / 原文时间:2026-05-17T01:17:51+00:00
快讯

GPT-5.6 / Sonnet 5 / Gemini 3.5 “本周齐发”说法未获证实

动察Beating AI News · 2026-05-18 15:42 CST

相关爆料账号过往有夸大记录,当前仅能视为社媒传闻,未见可靠证据支持。

已按未确认信息处理,不作为确定新闻。

来源:Telegram OneMillion_AI / 原文时间:2026-05-18T07:42:40+00:00
快讯

OpenAI / xAI / 腾讯 / 阿里云动作密集,产品化节奏继续加快

动察Beating AI News · 2026-05-18 晚间汇总

从编程代理、语音交互、设计即代码到知识库产品,今天的更新几乎都在把 AI 从“聊天”推向“执行”。

短期看,产品形态变化比模型参数更值得关注。

汇总:基于 OneMillion_AI 最近 24 小时消息