OpenRouter 完成 1.13 亿美元 B 轮融资
平台称每周处理量已达 25 万亿 tokens,支持 400+ 模型的统一路由。新资金将投向路由、治理与优化能力,AI 中间层竞争继续升温。
平台称每周处理量已达 25 万亿 tokens,支持 400+ 模型的统一路由。新资金将投向路由、治理与优化能力,AI 中间层竞争继续升温。
官方披露 MiniMax Sparse Attention 架构后,在 100 万 tokens 场景中,Prefill 注意力延迟约快 9.7 倍,Decode 约快 15.6 倍,长上下文效率再被拉高。
报告披露 Sigmoid 路由、MTP 以及面向 Agent 的 Forge 训练系统,且给出多项训练与评测结果,显示其在模型与工程双侧持续加码。
因缓存命中头失效导致长提示词重复计算,xAI 完成修复并部署告警与回归测试,显示终端编程智能体正进入更成熟的工程化治理阶段。
插件在编辑、会话结束与提交三个阶段做安全检测,可拦截动态执行、不安全反序列化等高危模式,说明编码 Agent 的安全栈正在前移。
文章强调环境层隔离的重要性,并披露从手动审批到沙箱/VM 的演进路径;对于高权限代理产品,出站控制与隔离边界已成核心竞争点。
MiMo-V2.5 系列输入、缓存与输出价格大幅下调,长文本溢价取消;配套订阅点数体系也同步升级,价格战进一步向开发者端扩散。
报道将 DeepSeek V4 与 MiMo 视为低成本 Agent 基础设施的代表:前缀缓存、稀疏注意力与多 token 预测成为压缩成本的关键路径。
若预算落地,字节的 AI 基础设施投入将远超国内同行,且明年还有可能继续上探至 1000 亿美元级别,算力竞争进入更激进阶段。
交易以合规边界设计规避出口限制,字节将获得数百万颗定制 ASIC 芯片,用于豆包等数据中心部署,显示大厂开始以供应链方式争夺算力。
指数纳入预期带来资金流入,叠加两家公司近期技术与商业化进展,AI 资产估值继续向核心龙头集中。
公司披露 2025 年收入、订单与成本结构,强调转向 ToB 后的商业化路径,市场对 AI 公司盈利模型的关注继续升温。
事件反映出订阅风控、User-Agent 识别与第三方生态兼容之间的张力,也提示 AI 工具链在“封控与开放”之间需要更细颗粒度治理。
产品从被动整理升级为主动交互,会员年费同步上调,个人知识管理赛道继续向 Agent 化与商业化双线演进。
这次回流被视为人才战的一部分,反映顶级分布式训练与基础设施人才在大厂之间的持续争夺。