今天是 2026 年 1 月 23 日,这一天绝对会被写进今年的 AI 编年史。Anthropic 和 Google 几乎在同一时间甩出了“王炸”,原本以为会是平淡的周五,结果变成了“代理(Agent)”与“世界模型”的正面拼刺刀,信息密度极高,我甚至没空看今天的加密盘面波动。
今日三件事
- Anthropic 突袭发布 Claude Opus 4.5:沉寂许久后,Claude 终于更新了最强版,剑指“计算机使用”和编码能力,号称当前地表最强 Agent 模型。
- Google DeepMind 祭出 Genie 3:这不是简单的视频生成,而是一个实时的“基础世界模型”,用户可以直接与生成的模拟世界交互,游戏和机器人领域要变天。
- 百度文心 5.0 参战:参数量飙升至 2.4 万亿,主打全模态统一建模,国内大模型在参数规模上又卷出了新高度。
逐条速记
Claude Opus 4.5 上线:Agent 的完全体?
发生了什么: Anthropic 刚刚更新了 Newsroom,正式发布 Claude Opus 4.5。官方称其为“世界上最适合编码、代理和计算机使用的模型”。除了常规的性能提升,重点优化了处理幻灯片、电子表格等日常任务的能力,且 Token 效率大幅提升。同时,Anthropic 还在推进医疗领域的深度整合。
我在意的点: “计算机使用(Computer Use)”是 2025 年底的大饼,Opus 4.5 似乎是真正把这个饼烙熟了。我特别关注它在复杂长流程任务(比如“帮我做个财报 PPT 并发邮件”)中的稳定性。如果它能稳定操作电子表格和 Slide,SaaS 软件的交互逻辑会被重写。
可能的影响: 企业级自动化工作流(RPA)将面临降维打击;对于开发者来说,Cursor 等辅助编程工具的“大脑”又升级了。
Google Genie 3:不仅是看,是可以“玩”
发生了什么: DeepMind 发布了 Genie 3。与上一代相比,Genie 3 允许用户生成一个世界模拟,并能与之进行实时交互。社交媒体上已经炸锅了,演示视频显示其物理一致性远超 Genie 2。
我在意的点: 这是通往 AGI 的另一条路——物理世界模拟。OpenAI 还在搞 Sora 的时候,DeepMind 已经把“视频”变成了“游戏”。如果 AI 能理解并模拟物理法则,机器人(Robotics)的训练数据匮乏问题就解决了。
可能的影响: 游戏开发门槛将进一步降低(育碧今天也刚好宣布押注 AI 引擎);机器人 Sim-to-Real(模拟到现实)的训练效率将指数级提升。
原文: Superhuman AI: Google and Anthropic release new models
百度文心 5.0:2.4 万亿参数的暴力美学
发生了什么: 百度刚刚重磅发布文心 5.0,参数量高达 2.4 万亿(Trillion)。官方宣称采用了“全模态统一建模技术”,在一个模型里同时处理文本、图像、音频和视频,不再是简单的“拼凑”。
我在意的点: 2.4T 的参数量非常惊人(GPT-4 时代传闻是 1.8T 左右的 MoE)。关键在于这 2.4T 是稠密还是稀疏?如果是 MoE 架构,推理成本如何?国内大模型竞争已经从“百模大战”进入了“巨头军备竞赛”,中小玩家很难跟进这种量级的算力消耗。
可能的影响: 国内 B 端应用(如智能客服、企业知识库)的能力天花板会被拉高;百度云的算力服务可能会与其深度绑定。
育碧(Ubisoft)战略转型:AI 成为新引擎
发生了什么: 育碧官宣战略大转型,在经历裁员和项目流产后,决定将生成式 AI 引入核心研发流程,聚焦开放世界和服务型游戏。
我在意的点: 传统 3A 大厂终于不只是在嘴上说 AI 了。结合今天 Google Genie 3 的发布,游戏行业的“手工作坊”时代正在结束。育碧这种体量的公司如果能跑通 AI 辅助开发的流程,游戏内容的产出速度将不再受限于人力。
可能的影响: 游戏股板块可能会有短期情绪波动;未来 3A 游戏的开发周期可能从 5-6 年压缩到 2-3 年。
日期:2026年01月22日
DeepMind CEO 炮轰 OpenAI:急着发广告太掉价
发生了什么: Demis Hassabis 在接受采访时表示,对 OpenAI 急于在 ChatGPT 中引入广告感到“惊讶”。与此同时,Google 宣布 Gemini 将根据 Gmail 和相册内容提供更深度的个性化服务(且不带广告)。
我在意的点: 这不仅仅是商业模式之争,是价值观之争。Google 本身是广告巨头,却在 AI 上表现得比 OpenAI 更克制(或者说更想用生态护城河来变现)。OpenAI 越来越像一家急于上市的互联网公司,而 DeepMind 还在努力维持“科研机构”的人设。
可能的影响: 用户可能会因为隐私和广告体验,在 Gemini 和 ChatGPT 之间重新站队。
原文: TechCrunch: Google DeepMind CEO is ‘surprised’
我自己的判断
今天的 AI 圈有一种“决战前夜”的窒息感。Anthropic 和 Google 都在向“行动(Action)”和“模拟(Simulation)”进军,这标志着 2026 年的主题不再是“聊天”,而是“干活”。
我看好 Anthropic 在短期内的企业级落地,Opus 4.5 对工具的掌控力是实打实的生产力。相比之下,Google 的 Genie 3 虽然技术更炫,但离普通人能用的产品还有距离。至于加密市场,虽然今天没细写,但 AI Agent 板块的代币(如 FET, TAO 等概念) 极大概率会因为 Opus 4.5 的发布而迎来一波炒作,因为“AI 能够自主操作电脑”是链上 Agent 能够真正跑通支付逻辑的前提。
明天我会继续盯
- Claude Opus 4.5 的 API 成本与延迟:好用还得用得起。
- 加密市场 AI 板块的资金流向:特别是与 Agent 基础设施相关的标的。
- OpenAI 的反应:Sam Altman 这么安静,绝对不正常,Sora 2.0 或 GPT-5 可能就在路上了。
- 育碧股价:看市场是否买单“AI 救厂”的故事。
- Github Trending:看有没有基于 Genie 3 或 Opus 4.5 的开源项目冒头。