今天是圣诞节后的第一个工作日,虽然市场交易量还没完全恢复,但技术圈的发布节奏一点没停。现在的风向非常明显:大家不再单纯卷参数规模,而是开始死磕“逻辑推理”和“长周期任务”的稳定性,这才是 AI Agent 真正落地的门槛。

今日三件事

  • 字节跳动突袭数学推理赛道:Seed 团队发布 Prover 1.5,用 Agentic RL(代理强化学习)把数学推理能力拉到了新高度。
  • 端侧模型“下克上”:Jan 团队发布 30B 参数模型,号称在长周期任务上稳压谷歌 Gemini 2.5 Pro,本地运行党狂喜。
  • “大模型第一股”来了:智谱 AI 正式通过港交所聆讯,二级市场终于要对国产 AGI 给出真金白银的定价了。

逐条速记

字节跳动发布 Seed Prover 1.5

发生了什么: 字节跳动 Seed 团队在 12 月 24 日发布了新一代形式化数学推理模型“Seed Prover 1.5”。他们没有堆算力,而是通过大规模的 Agentic RL(代理强化学习)训练,让模型在数学证明和逻辑推理上的效率大幅提升。

我在意的点: 这不仅仅是做数学题。数学推理是 AI 具备“系统 2”(慢思考)能力的核心基石。字节这次强调“Agentic RL”,说明他们在让 AI 像人一样“自我反思、多步规划”这条路上走得很深。这也意味着字节在追赶 OpenAI o1/o3 系列的推理能力上,有了自己的解题思路。

可能的影响: 对于需要高精度逻辑的代码生成、金融风控场景,这类模型会是杀手锏。这也可能逼迫其他大厂公开更多关于 RL(强化学习)的训练细节。

原文: TechNews: 字節跳動推新一代數學模型

Jan-v2-VL-Max:30B 模型专攻“长任务”

发生了什么: Jan 团队发布了 300 亿参数的多模态模型 Jan-v2-VL-Max。最离谱的是,他们在 Benchmark 中宣称,在处理长周期、多步骤的 Agent 任务时,这个“小”模型表现甚至超过了谷歌的 Gemini 2.5 Pro 和 DeepSeek R1。

我在意的点: 这就是我最近常说的“模型精悍化”趋势。30B 的参数量意味着高端消费级显卡(甚至 Mac Studio)就能跑得动。如果它在长序列任务(比如写完整个项目代码、整理长篇财报)中真的不“幻觉”、不“掉链子”,那云端大模型的护城河又被填平了一截。

可能的影响: 本地部署的 AI Agent 会迎来一波爆发,隐私敏感的加密货币交易员和开发者会更倾向于用这种本地模型来处理私钥和策略代码。

原文: AIbase: Jan团队发布Jan-v2-VL-Max

量子计算与 AI 的“百路汇流”

发生了什么: 知名投资人 Altucher 在今天的报告中抛出一个观点:量子计算正在成为打破 AI 算力瓶颈的关键拼图,他预测这将引发一场价值 111 万亿美元的“技术碰撞”。

我在意的点: 虽然数字听起来很像营销话术,但逻辑值得关注。现在的 AI 确实撞上了能耗和硅基芯片的物理墙。如果量子计算在 2026 年能有实质性突破(哪怕是纠错方面的),AI 的迭代速度会再次指数级跃升。

可能的影响: 在加密市场,这会利好两个板块:一是 DePIN(去中心化算力网络),二是抗量子密码学(Quantum-Resistant)概念币。

原文: Manila Times: $111 Trillion Tech Collision

日期:2025年12月20日

智谱 AI 冲刺港股 IPO

发生了什么: 智谱 AI(Zhipu)已正式通过港交所聆讯并递交招股书,预计很快挂牌,成为中国“大模型第一股”。

我在意的点: 这是一次关键的“验资”。此前一级市场把估值炒得很高,现在到了二级市场见真章的时候。如果智谱能守住估值,MiniMax、月之暗面(Moonshot)等后续梯队的上市路会好走很多;如果破发,整个赛道的融资逻辑都要重写。

可能的影响: 资本市场会将注意力从“讲故事”转移到“商业化营收(ARR)”。对于 AI 创业者来说,拿钱会更难,但行业泡沫会被挤出。

原文: NCSTI: 北京将诞生“大模型第一股”

我自己的判断

现在的 AI 行业正在经历“去魅”阶段。2025 年底的我们,不再为单纯的“聊天机器人”感到兴奋,而是看谁能把 Agent(智能体) 真正用起来。字节和 Jan 团队的新动作都在证明一点:推理能力执行稳定性比单纯的知识广度更重要。

在加密市场方面,我倾向于认为 AI Agent 将成为链上最活跃的“用户”。如果本地小模型(如 Jan-v2)能稳定执行任务,明年我们会看到大量 AI 自动管理的 DeFi 策略钱包。所以我现在的策略是:看多基础设施(算力、存储),谨慎对待纯应用层的 Meme 币。

明天我会继续盯

  • MiniMax M2.5 的动向:数据平台显示已有传闻,我需要确认是否会在元旦前突击发布。
  • OpenAI 的反击:Google 和 Anthropic 最近动作频频,Sam Altman 沉默得有点久,通常这意味着大招在憋着。
  • Solana 上的 AI Agent 币:观察是否有项目开始集成最新的推理模型(如 Seed Prover)来优化链上交易策略。
  • 智谱 IPO 的招股定价:这将是明年 Q1 AI 板块情绪的风向标。