2026 AI代理战争爆发：Claude 4.5 对决 Genie 3

今天是 2026 年 1 月 23 日，这一天绝对会被写进今年的 AI 编年史。Anthropic 和 Google 几乎在同一时间甩出了“王炸”，原本以为会是平淡的周五，结果变成了“代理（Agent）”与“世界模型”的正面拼刺刀，信息密度极高，我甚至没空看今天的加密盘面波动。

今日三件事

Anthropic 突袭发布 Claude Opus 4.5：沉寂许久后，Claude 终于更新了最强版，剑指“计算机使用”和编码能力，号称当前地表最强 Agent 模型。
Google DeepMind 祭出 Genie 3：这不是简单的视频生成，而是一个实时的“基础世界模型”，用户可以直接与生成的模拟世界交互，游戏和机器人领域要变天。
百度文心 5.0 参战：参数量飙升至 2.4 万亿，主打全模态统一建模，国内大模型在参数规模上又卷出了新高度。

逐条速记

Claude Opus 4.5 上线：Agent 的完全体？

发生了什么： Anthropic 刚刚更新了 Newsroom，正式发布 Claude Opus 4.5。官方称其为“世界上最适合编码、代理和计算机使用的模型”。除了常规的性能提升，重点优化了处理幻灯片、电子表格等日常任务的能力，且 Token 效率大幅提升。同时，Anthropic 还在推进医疗领域的深度整合。

我在意的点： “计算机使用（Computer Use）”是 2025 年底的大饼，Opus 4.5 似乎是真正把这个饼烙熟了。我特别关注它在复杂长流程任务（比如“帮我做个财报 PPT 并发邮件”）中的稳定性。如果它能稳定操作电子表格和 Slide，SaaS 软件的交互逻辑会被重写。

可能的影响： 企业级自动化工作流（RPA）将面临降维打击；对于开发者来说，Cursor 等辅助编程工具的“大脑”又升级了。

原文： Anthropic Newsroom

Google Genie 3：不仅是看，是可以“玩”

发生了什么： DeepMind 发布了 Genie 3。与上一代相比，Genie 3 允许用户生成一个世界模拟，并能与之进行实时交互。社交媒体上已经炸锅了，演示视频显示其物理一致性远超 Genie 2。

我在意的点： 这是通往 AGI 的另一条路——物理世界模拟。OpenAI 还在搞 Sora 的时候，DeepMind 已经把“视频”变成了“游戏”。如果 AI 能理解并模拟物理法则，机器人（Robotics）的训练数据匮乏问题就解决了。

可能的影响： 游戏开发门槛将进一步降低（育碧今天也刚好宣布押注 AI 引擎）；机器人 Sim-to-Real（模拟到现实）的训练效率将指数级提升。

原文： Superhuman AI: Google and Anthropic release new models

百度文心 5.0：2.4 万亿参数的暴力美学

发生了什么： 百度刚刚重磅发布文心 5.0，参数量高达 2.4 万亿（Trillion）。官方宣称采用了“全模态统一建模技术”，在一个模型里同时处理文本、图像、音频和视频，不再是简单的“拼凑”。

我在意的点： 2.4T 的参数量非常惊人（GPT-4 时代传闻是 1.8T 左右的 MoE）。关键在于这 2.4T 是稠密还是稀疏？如果是 MoE 架构，推理成本如何？国内大模型竞争已经从“百模大战”进入了“巨头军备竞赛”，中小玩家很难跟进这种量级的算力消耗。

可能的影响： 国内 B 端应用（如智能客服、企业知识库）的能力天花板会被拉高；百度云的算力服务可能会与其深度绑定。

原文： AI Base: 百度重磅推出文心 5.0

育碧（Ubisoft）战略转型：AI 成为新引擎

发生了什么： 育碧官宣战略大转型，在经历裁员和项目流产后，决定将生成式 AI 引入核心研发流程，聚焦开放世界和服务型游戏。

我在意的点： 传统 3A 大厂终于不只是在嘴上说 AI 了。结合今天 Google Genie 3 的发布，游戏行业的“手工作坊”时代正在结束。育碧这种体量的公司如果能跑通 AI 辅助开发的流程，游戏内容的产出速度将不再受限于人力。

可能的影响： 游戏股板块可能会有短期情绪波动；未来 3A 游戏的开发周期可能从 5-6 年压缩到 2-3 年。

原文： AI Base: 育碧官宣战略大转型

日期：2026年01月22日

DeepMind CEO 炮轰 OpenAI：急着发广告太掉价

发生了什么： Demis Hassabis 在接受采访时表示，对 OpenAI 急于在 ChatGPT 中引入广告感到“惊讶”。与此同时，Google 宣布 Gemini 将根据 Gmail 和相册内容提供更深度的个性化服务（且不带广告）。

我在意的点： 这不仅仅是商业模式之争，是价值观之争。Google 本身是广告巨头，却在 AI 上表现得比 OpenAI 更克制（或者说更想用生态护城河来变现）。OpenAI 越来越像一家急于上市的互联网公司，而 DeepMind 还在努力维持“科研机构”的人设。

可能的影响： 用户可能会因为隐私和广告体验，在 Gemini 和 ChatGPT 之间重新站队。

原文： TechCrunch: Google DeepMind CEO is ‘surprised’

我自己的判断

今天的 AI 圈有一种“决战前夜”的窒息感。Anthropic 和 Google 都在向“行动（Action）”和“模拟（Simulation）”进军，这标志着 2026 年的主题不再是“聊天”，而是“干活”。

我看好 Anthropic 在短期内的企业级落地，Opus 4.5 对工具的掌控力是实打实的生产力。相比之下，Google 的 Genie 3 虽然技术更炫，但离普通人能用的产品还有距离。至于加密市场，虽然今天没细写，但 AI Agent 板块的代币（如 FET, TAO 等概念） 极大概率会因为 Opus 4.5 的发布而迎来一波炒作，因为“AI 能够自主操作电脑”是链上 Agent 能够真正跑通支付逻辑的前提。

明天我会继续盯

Claude Opus 4.5 的 API 成本与延迟：好用还得用得起。
加密市场 AI 板块的资金流向：特别是与 Agent 基础设施相关的标的。
OpenAI 的反应：Sam Altman 这么安静，绝对不正常，Sora 2.0 或 GPT-5 可能就在路上了。
育碧股价：看市场是否买单“AI 救厂”的故事。
Github Trending：看有没有基于 Genie 3 或 Opus 4.5 的开源项目冒头。

今日三件事#

逐条速记#

Claude Opus 4.5 上线：Agent 的完全体？#

Google Genie 3：不仅是看，是可以“玩”#

百度文心 5.0：2.4 万亿参数的暴力美学#

育碧（Ubisoft）战略转型：AI 成为新引擎#

日期：2026年01月22日#

DeepMind CEO 炮轰 OpenAI：急着发广告太掉价#

我自己的判断#

明天我会继续盯#