谷歌发布超轻量 Gemma 4,端侧内存降至 1GB 以下
突破谷歌推出 Gemma 4 量化压缩版,结合量化感知训练与移动端定制优化,让 E2B 纯文本模型可在手机等设备上以更低内存运行,同时保持较高智能水平,并已开源到 Hugging Face。
聚焦模型、研究、推理基础设施与 AI 产品动作,筛选 13 条高价值动态。
谷歌推出 Gemma 4 量化压缩版,结合量化感知训练与移动端定制优化,让 E2B 纯文本模型可在手机等设备上以更低内存运行,同时保持较高智能水平,并已开源到 Hugging Face。
Anthropic 报告显示,未经化学微调的通用模型在氢谱、碳谱和部分逆向结构解析任务上,表现已接近或超过 ChemDraw、MestReNova 等专业工具,科研 AI 能力继续外溢。
Sakana AI 在东京设立 RSI Lab,主打自我进化研究智能体,整合自主优化、演化分支和开源自动化研发成果,继续押注“AI 研究 AI”。
新架构加入多智能体检索、质量控制与补检闭环,在多源多步检索场景中显著压制幻觉,适合企业级知识问答与事实核验。
这款 12B 代码 MoE 模型把多 token 预测模块直接做成草稿模型,兼顾低延迟与长上下文,面向 IDE 与智能体工作流中的路由、检索和子任务验证。
dots.tts 采用全连续架构,不依赖离散 codec token,强调音质、音色相似度与情感表达,适合语音智能体和高保真生成任务。
这项检索智能体把记忆与整理工作交给环境端维护,仅用少量轨迹和强化学习查询就取得强表现,显示“外置状态”可能是提升长程检索效率的关键路线。
Vibe coding 赛道继续升温,若融资落地,估值将较上一轮接近翻倍,反映市场对 AI 原生开发工具的高定价预期。
披露文件显示,谷歌将长期租用约 11 万张 NVIDIA GPU 算力,市场对超大规模算力供给、xAI 生态与合同结构的关注度继续上升。
锁定模式通过限制联网、深度研究与数据通道,强化防提示词注入的边界式安全策略,说明主流产品对“可控性”要求正在提高。
美国政府 AI 政策团队即将换人,但其任内推动的 AI 行动计划、合作伙伴关系和政策框架仍会影响后续监管与产业协作。
用户可在 Writing Blocks 内完成起草、修改到发送的全流程,减少在 ChatGPT 与邮箱客户端之间来回切换。
通过点击、圈选或语音描述,Cursor 让 AI 直接抓取界面上下文并改代码,进一步把“看见产品—修改产品”的流程压缩到同一窗口内。