COPU会议纪要丨2026.03.10

3月10日,陆主席主持召开COPU例会。
谈DeepSeekv4执行自主智能体(AI Agent)复杂任务
陆首群,2026.3.8
Anthropic公司于2月6日深夜发布Claude Opus4.6登顶成为“编程之王”。2026年2月24日COPU发表《东西方竞相争夺编程王冠》的文章。西方争夺“编程王冠”的有Anthropic的Claude Opus4.6大模型、谷歌的Gemini3-pro大模型、Open AI的GPT5.2xhigh大模型,东方有深度求索的Deepseek v4大模型、智谱AI的GLM4.7大模型、月之暗面的Kimi-k2.5大模型。
这场竞争从表面看是争夺全球编程技术排名榜的名次,实质上是整个AI行业正在经历一次深刻的战略转向;而选择编程作为主战场,背后主要有两大深层逻辑:最清晰的商业路径和最硬核技术的战略转向。
商业路径是从“成本中心”到“价值中心”。相比通用的聊天机器人模糊的变现方式,编程能力是少数能直接兑现商业价值的场景。
谈到最硬核技术试验场,这是一条通往通用人工智能(AGI)的必经之路,能到达终极目的,跨越多模态、超长上下文窗口、自主智能体(AI Agent)、处理复杂任务、具身、世界模型等过渡阶段(及其核心技术)是必不可少的环节。
DeepSeek在直面AGI,跨越诸多过渡阶段时,起步是慢了一些,但随后发展很快,并富有特色。
DeepSeek V4的核心技术是:①稀疏注意力机制MoE及其迭代(MoE不是DeepSeek的首创,DeepSeek对其最大贡献是研发稀疏机制。这得益于梁文锋的母校浙江大学,浙大是全球第三家研发基于异步脉冲神经网络/类脑神经网络SNN的神经拟态计算系统,这是提供稀疏机制的源头)。
MoE(当参数被激化时)其训练成本约为其他传统大模型的1/20,在进行迭代后,MoE(当专家被激化时)其训练成本降到约1/30,MoE(研发动态路由或选择mHC-Engram后)又降到约1/60。
DeepSeekV4与清华北大合作,研究了Dual path双通道加载技术,解决了在传统推理架构中网络拥堵、GPU闲置、解码引擎带宽浪费、资源错配等瓶颈,在调度全局算法后,进一步打开了降本增效的大门。
AI Agent技术在DeepSeek V4中处于核心地位。
《Dual Path》专门针对智能体推理现场情景优化,在660B规模模型实测中,在线服务吞吐量平均提升1.96倍,这正是DeepSeek V4 Agent战略的技术铺垫。
这些核心技术体现了DeepSeek在直面AGI的研究过程中的特色。
②研发智能体(Agent)时代需要的自主智能体(AI Agent)。
最近梁文峰常说:“V4是直指Agent时代的”,“V4是为Agent时代准备的”。
Anthropic也认为:“研发Claude Opus4.6,是为了更好、更持久地执行AI Agent的复杂任务”,“搞编程Agent只是其敲门砖”。
所谓AI Agent是一种能感知环境(进入物理世界、引进世界模型,掌握本地及世界知识并深化知识记忆),设定并追求长期及过渡目标(如锁定AGI及过渡阶段),通过长上下文窗口,自主推理、规划、调用(工具或API)、管理(其他智能体及自身)、协调(其他智能体)、决策与执行未来完成宏大或分布式的复杂任务(包括处理多重复杂任务使Agent SDK能跨多个上下文窗口有效工作,以及长时运行智能体)。
AI Agent核心技术的“七环架构”
根据DeepSeek的技术布局,AI Agent的核心技术可归纳为以下七个维度:
①自主推理:将复杂目标分解为可执行的行动序列(百万token上下文窗口支持超长推理链条规划能力及分步行动计划,Engram条件记忆架构支持长程任务规划)
②工具调用
③状态管理
④多智能体协调管理及分工协作
⑤决策执行(包括MoE2.0动态路由技术,环境互动)
⑥MoE 2.0 动态路由技术
⑦环境互动
DeepSeek V4为Agent时代准备的三大技术支柱:
①百万token上下文----支持超长任务记忆
②Dual Path推理框架----解决Agent的I/O瓶颈
③Engram条件记忆架构----实现O(1)检索
行业刚需学习与DeepSeek V4的战略匹配
梁文锋提到金融、法律、工业三个行业,正是agent技术最能发挥价值的领域:
金融研报分析、欺诈检测、信贷审核百万token处理海量文档等
法律合同审核、案例检索、卷宗梳理、漏检率
工业工艺设备预测性维护、代码库迁移
从AI Agent到AGI战略转轨
在COPU发表《东西方竞相争夺编程王冠》的文章并发表《续篇》后,就收到不少留言,希望点评《claude Opus4.6 VS DeepSeek V4》,当时我们答复:等DeepSeek V4 声称在3月初公布后再说。由于模型规模增至万亿参数级别,训练周期拉长,可能导致V4发布时间延期。据了解,DeepSeek V4公布虽然延期但不久就要公布了,请大家拭目以待!
AI Agent的核心技术可概括为:
以大模型为“大脑”,以规划推理为“思维”,以工具调用为“手脚”,以智能体协作为“团队”,以环境互动为“感知”。DeepSeek V4是为实现这一图景设计的。它不只是更强的模型,更是Agent时代的基础设施。
自主智能体(AI Agent)发展要点
陆首群2026.3.8
一、与AI大师们的对话:
大师们回话:
感谢您对V4和AI Agent的持续关注
您关于V4延期和Agent技术核心地位的判断是准确的
您关于AI Agent技术直接AGI,以及当前的语言大模型走向AGI转轨的提议非常准确的。
二、与DeepSeek AI资深专家对话要点:
Agent战略定位
DS与北清合作,发表重磅论文《Dual Path》,专门针对智能体推理场景优化。这是V4 Agent战略的技术铺垫。
AI Agent核心技术的“七环架构”(七个维度)
①自主推理将复杂目标分解为可执行的行动序列
理解任务间的依赖关系(V4的百万token上下文窗口支持超长推理链条规划能力,Engram条件记忆支持长程任务规划)
制定多步行动计划
②工具调用
③状态管理
④多智能体协调管理及分工协作
⑤决策执行
⑥MoE2.0动态路由技术
⑦环境互动
DeepSeek V4与华为昇腾深度适配,为物理世界(世界模型)部署铺路
V4为Agent时代准备的三大技术支柱
①百万token上下文——支持超长任务记忆
②Dual Path推理框架——解决Agent的I/O瓶颈
③Engram条件记忆架构——实现O(1)检索
传统Transformer处理上下文面临O(n²)计算复杂度问题
Engram架构将长期记忆单独拎出,做成O(1)检索的模块,为Agent提供:
o持久化上下文
o长任务规划
o多轮对话一致性(避免重要提问)
行业刚需场景与V4战略匹配
金融、法律、工业三个行业,正是Agent技术最能发挥价值的领域
从AI Agent到AGI的战略转轨
AI Agent技术直指AGI(您的这一判断非常正确,现已形成行业共识)
当前行业的共识是:AGI的实现路径正在从“规模扩张”转向“自主智能”。
英伟达黄仁勋在2026 CES上明确提出“物理AI”概念
强调AI将进入理解、推理并作用于物现世界的新阶段
北京智源也提出,AI正从“预测下一个词”转向“预测世界下一状态”。
DeepSeek正是这一战略转轨的具体实践:
①通过百万上下文解决记忆问题
②通过Dual Path解决效率问题
③通过国产算力适配解决自主可控问题
④通过MoE+Engram+mHC架构组合,实现万亿参数下的稳定高效运行
AI Agent的核心技术可概括为
①以大模型为“大脑”
②以规划推理为“思维”
③以工具调用为“手脚”
④以多智能体协作为“团队”
⑤以环境互动为“感知”
DeepSeek V4 正是为实现这一图景而设计的,它不只是更强的模型,更是Agent时代的基础实施。
梁文锋:V4是为Agent时代准备的:当模型具备了百万级记忆、近乎无损的推理效率、工具调用能力之时,AI Agent才能真正从“对话助手”进化为“自主执行者”,这是AI通往AGI的关键一步。
参会人员:陆首群、陈伟、章文嵩、安泱、袁怿、谭中意、鞠东颖、孟迎霞、宋可为、张侃、陈连虎、刘澎(线上)、靳虹博(线上)、胡宇(线上)、韩宪平(线上)、Anna.AI(线上)。
