2026年刚开年,模型层的厮杀就没有停下来的意思,但今天的风向明显变了:大家不再只盯着跑分,而是开始死磕“落地效率”和“硬件底座”。从 DeepSeek 的新记忆模块到苹果的自研服务器芯片,巨头和新贵们都在通过架构创新来压低 AI 的边际成本,这比单纯发一个更大的模型更让我兴奋。

今日三件事

  • DeepSeek 推出 Engram 模块:给稀疏大模型(MoE)装上了“条件记忆轴”,专门解决 Transformer 处理重复知识时的算力浪费,效率提升显著。
  • 苹果加速云端自研芯片:郭明錤爆料苹果正在憋大招,自研服务器芯片“Baltra”预计下半年量产,摆明了要自己在云端掌控 AI 推理成本。
  • 支付宝发布 ACT 协议:联合通义千问搞了个“AI 商业通用语言”,试图打通 Agent 与电商、外卖服务的接口,让 AI 真正能“帮我买东西”。

逐条速记

DeepSeek 给模型装上了“外挂海马体”

发生了什么: DeepSeek 团队今天发布了一个名为 “Engram” 的新模块。简单来说,它为稀疏大语言模型引入了一种“条件记忆轴”。这个技术主要针对的是传统 Transformer 的痛点——每次处理重复知识都要重新计算,极度浪费资源。Engram 能把这些信息高效存储起来,随取随用。

我在意的点: 这招很聪明,直击长文本推理的“贵”字痛点。Transformer 的老毛病就是“记性差且算力贵”。Engram 听起来像是把 RAG(检索增强生成)的思路内化到了模型权重和推理机制里,不再是外挂,而是原生记忆。

可能的影响: 如果这种架构能成为行业标准,长窗口(Long Context)推理的成本可能会腰斩。对于法律、金融这种需要处理海量历史文档的 B 端应用来说,是巨大的利好。

原文: AIBase: DeepSeek 推出 Engram 模块

苹果终于要对云端算力下手了

日期:2026年01月15日 发生了什么: 根据郭明錤的最新报告,苹果正在加速开发代号为“Baltra”的自研服务器芯片,专攻 AI 推理任务,预计 2026 年下半年就会量产并部署。

我在意的点: 苹果向来喜欢软硬通吃。现在 Apple Intelligence 的用户量上来后,用别人的 GPU(比如英伟达)跑云端推理太贵,而且受制于人。自研芯片上线后,Siri 和云端 Agent 的响应速度估计会有质变,更重要的是成本控制权回到了自己手里。

可能的影响: 英伟达的数据中心业务可能会少一个超级大客户,同时也给其他手机厂商打了个样:云端推理芯片将是下一个必争之地,单纯依赖通用 GPU 的日子可能要结束了。

原文: TechNews: 苹果传 2026 下半年量產 Baltra 自研晶片

能源焦虑引爆 Crypto 市场:核能与 DePIN 的共舞

发生了什么: 国际原子能机构(IAEA)总干事格罗西在维也纳强调,AI 需要超高功率密度的稳定电力,核能复兴已成定局。受此消息影响,加密市场中与能源 RWA(现实世界资产)及算力 DePIN 相关的板块今日出现明显异动。

我在意的点: AI 越强,电越缺。传统的电网扩容速度根本跟不上 AI 数据中心的建设速度。链上的分布式能源交易和算力调度,反而成了资金博弈的出口。IAEA 的表态只是一个官方背书,市场早就在押注“能源即算力”这个逻辑了。

可能的影响: 2026 年 Crypto 的主线很可能是“能源+算力”。那些真正手里有电厂资源、或者能解决算力调度的 DePIN 项目,会比单纯发 Meme 的项目更有生命力。

原文: UN News: 人工智能驱动下的核能复兴

支付宝想做 AI Agent 的“通用语言”

发生了什么: 支付宝联合通义千问、淘宝闪购等发布了中国首个 AI 商业协议 “ACT”。这个协议旨在为 AI Agent 与各类服务平台(电商、外卖等)建立一套标准化的接口语言。

我在意的点: 这是一个非常务实的信号。之前的 Agent 大多是“嘴炮”,能聊天但干不了活。最大的阻碍就是各家 APP 的接口不互通。有了 ACT 这种协议,AI 才能真正跨越“聊天框”,帮我买咖啡、订票、退款,完成商业闭环的最后一公里。

可能的影响: 可能会加速国内“行动类”Agent 的爆发。一旦支付和履约打通,AI 就不再只是效率工具,而是直接的消费入口,商业价值翻倍。

原文: 量子位: 支付宝发布中国首个AI商业协议ACT

我自己的判断

2025 年大家都在拼谁的模型参数大、谁的榜单分高,到了 2026 年初,明显感觉到风向转到了“省钱”和“落地”上。

无论是 DeepSeek 的记忆优化,还是苹果造芯,本质都是在为 AI 的大规模普及降本。我看好今年不仅是 AI 应用爆发年,更是“AI 基础设施”洗牌的一年——谁能把推理成本压到极致,谁就是赢家。同时,Crypto 市场与 AI 的结合点正在从单纯的炒作转向底层的“能源与算力”置换,这可能是一个长达一年的慢牛叙事。

明天我会继续盯

  • DeepSeek Engram 的开源代码或论文细节(如果有的话)。
  • 美股软件板块对 Anthropic 新产品的后续反应(SaaS 杀跌是否持续)。
  • 加密市场 DePIN 板块特别是能源类代币的资金流向。
  • GPT-5.2 在更多真实代码场景下的表现(对比 Claude Opus 4.5)。