推出三款 API 语音模型(Realtime-2, Translate, Whisper),带来 GPT-5 级别的推理能力。在 Big Bench Audio 测试中得分从 81.4% 跃升至 96.6%,支持实时工具调用与更拟人的语调控制。
通过多层 Agent 架构(协调、检索、推理、审稿),DeepMind 在研究级数学基准 FrontierMath Tier 4 上拿下 47.9% 正确率,解出 3 道此前无模型能解的难题,远超 GPT-5.5 Pro。
Tilde Research 发现热门优化器 Muon 会导致 MLP 层超 1/4 神经元死亡。新推出的 Aurora 在保持正交性的同时确保更新均匀,1.1B 模型仅用 100B token 即逼平 Qwen3-1.7B (36T token)。
开源 TwELL 稀疏格式,让 H100 推理提速 30%,训练提速 24%。利用大模型 FFN 层中大量“休眠神经元”的特性,针对 GPU 并行逻辑优化,大幅降低显存开销。
由于内存成本上涨及业务扩张,字节今年资本支出增幅超 25%。受地缘政治及政策影响,预算重心正大幅转向国产 AI 芯片,规避英伟达 H200 准入限制风险。
马斯克诉 Altman 案证据显示,Murati 是推动解雇的主力(曾递交投诉清单并协助 Sutskever),但在风向反转后又是第一个联名要求 Altman 复职的高管。
官方邮件确认将全面停止自助微调服务,理由是新一代基座模型指令遵循能力已足够强大。此举引发初创团队担忧,因为利用微调构建行业壁垒的路径被收窄。
传闻公司估值达 3500 亿人民币。此轮融资旨在应对人才流失(如郭达雅离职)与高端算力采购需求,DeepSeek 正从纯研究机构转向商业实战。
新成立的研究机构发布议程,重点研究 AI 系统自我完善的可能性,提议实验室间建立“冷战式红线”与“紧急演习”机制,以应对可能的智力爆炸。
antirez 发布专为 Apple Silicon 定制的极简引擎,通过 2-bit 非对称量化与 KV 缓存持久化,在个人设备上压榨出极限推理性能。
千问 App 接入淘宝 40 亿商品库,支持一句话下单、比价、凑单、售后及 AI 试穿。中美电商 AI 落地路线出现分化,阿里更倾向于全链路自动化。
专门解决智能体操作电脑的坐标预测问题。测试显示坐标直接输出数字的效果优于位置词汇表,准确率在同规模模型中排名第一。
内部股票交易允许员工每人最高出售 3000 万美元股份。75 人拿到顶格额度,总裁 Brockman 持股价值约达 300 亿美元。
用于军事数据分析。这一合同规模较去年 9 月增长了 5 倍,显示出军方对 AI 基础设施的投入正在激增。