1. 智谱 GLM-5.2 开放 1M 上下文,API 与开源同步在即
突破GLM-5.2 已面向 GLM Coding Plan 全量用户开放,支持 100 万上下文,并提供 High / Max 两档思考强度;官方称下周将上线 API 与 Chatbot,并按 MIT 协议开源模型权重。
过去 24 小时内的高价值 AI 动态,优先收录模型、基础设施、平台与监管方向。
GLM-5.2 已面向 GLM Coding Plan 全量用户开放,支持 100 万上下文,并提供 High / Max 两档思考强度;官方称下周将上线 API 与 Chatbot,并按 MIT 协议开源模型权重。
AA-AgentPerf 首个智能体硬件基准显示,GB300 NVL72 每兆瓦可承载 6.14 万并发智能体,H200 仅 2600;评测将“每兆瓦并发智能体规模”作为核心指标,直接反映数据中心能耗压力。
Fusion 将提示并行分发给多个模型,再由裁判与合成模型输出最终答案;在 DRACO 深度研究基准中,Fable 5 + GPT-5.5 的组合在 Opus 4.8 合成下达到 69.0%,高于 Fable 5 单模 65.3%。
里约市政府开源基于 Qwen 3.5 397B 的 MoE 模型,支持约 100 万 Token 上下文,并引入 SwiReasoning;开启隐式推理后,SWE-Bench Pro 与 IMOAnswerBench 成绩较基座模型明显提升。
剑桥大学与芝加哥大学团队提出 DecentMem,以 E-pool / X-pool 双池记忆替代共享记忆;在多项框架测试中,平均提升 8.6%,最佳场景相对提升 23.8%,同时将 Token 消耗减半。
OKF v0.1 以 Markdown 目录树、索引与日志文件组织企业知识,试图把 Karpathy 的 LLM-Wiki 思路标准化;重点是让 AI 直接维护内部背景资料,降低检索管线重复建设成本。
报道显示,Amazon 向财政部告知可绕过 Fable 5 防护、触达底层模型生成漏洞验证代码,随后白宫与 NSA 介入并下达出口限制;事件直指模型安全、国家安全与商业利益交织。
观点认为,出口限制会强化 AWS / Azure / GCP 等云巨头对模型分发与合规的门槛控制,独立实验室若继续依赖外部云与缺乏 KYC 防线,未来议价权可能进一步收缩。
Omnigent 运行在 Claude Code、Codex 等工具之上,通过 meta-harness 统一实施有状态安全控制、成本上限与审批流程,显示 Agent 生态正从“单点能力”转向“统一治理”。
Google 与 UCSD 研究将 2000 部退役 Pixel 主板重组为低碳云数据中心,目标约等于 50 台传统服务器;这类方案体现消费级硬件再利用与边缘算力部署的新思路。
Meta 正构建 AI Gateway 监控员工 Token 与预算,并设上限控制内部 AI 开支;这一动作与此前鼓励高频使用 AI 的策略形成反差,反映大厂内部成本治理开始收紧。
Z.ai 海外平台被开发者反馈重复上下文未正确触发缓存计费,实际约 27 万 Token 的使用却被计成近 500 万;异常看起来来自服务端缓存与记账系统,而非客户端工具。
本报告仅基于 Telegram 频道 @OneMillion_AI 的公开预览内容整理,已按北京时间转换并筛选过去 24 小时内的条目。重点保留模型、推理、Agent 基础设施、监管与平台治理相关信息。