COPU会议纪要丨2026.03.10

2026-03-11 11:18:56 90

图片关键词

3月10日，陆主席主持召开COPU例会。

谈DeepSeekv4执行自主智能体(AI Agent)复杂任务

陆首群，2026.3.8

Anthropic公司于2月6日深夜发布Claude Opus4.6登顶成为“编程之王”。2026年2月24日COPU发表《东西方竞相争夺编程王冠》的文章。西方争夺“编程王冠”的有Anthropic的Claude Opus4.6大模型、谷歌的Gemini3-pro大模型、Open AI的GPT5.2xhigh大模型，东方有深度求索的Deepseek v4大模型、智谱AI的GLM4.7大模型、月之暗面的Kimi-k2.5大模型。

这场竞争从表面看是争夺全球编程技术排名榜的名次，实质上是整个AI行业正在经历一次深刻的战略转向；而选择编程作为主战场，背后主要有两大深层逻辑：最清晰的商业路径和最硬核技术的战略转向。

商业路径是从“成本中心”到“价值中心”。相比通用的聊天机器人模糊的变现方式，编程能力是少数能直接兑现商业价值的场景。

谈到最硬核技术试验场，这是一条通往通用人工智能（AGI）的必经之路，能到达终极目的，跨越多模态、超长上下文窗口、自主智能体（AI Agent）、处理复杂任务、具身、世界模型等过渡阶段（及其核心技术）是必不可少的环节。

DeepSeek在直面AGI，跨越诸多过渡阶段时，起步是慢了一些，但随后发展很快，并富有特色。

DeepSeek V4的核心技术是：①稀疏注意力机制MoE及其迭代（MoE不是DeepSeek的首创，DeepSeek对其最大贡献是研发稀疏机制。这得益于梁文锋的母校浙江大学，浙大是全球第三家研发基于异步脉冲神经网络/类脑神经网络SNN的神经拟态计算系统，这是提供稀疏机制的源头）。

MoE（当参数被激化时）其训练成本约为其他传统大模型的1/20，在进行迭代后，MoE（当专家被激化时）其训练成本降到约1/30，MoE（研发动态路由或选择mHC-Engram后）又降到约1/60。

DeepSeekV4与清华北大合作，研究了Dual path双通道加载技术，解决了在传统推理架构中网络拥堵、GPU闲置、解码引擎带宽浪费、资源错配等瓶颈，在调度全局算法后，进一步打开了降本增效的大门。

AI Agent技术在DeepSeek V4中处于核心地位。

《Dual Path》专门针对智能体推理现场情景优化，在660B规模模型实测中，在线服务吞吐量平均提升1.96倍，这正是DeepSeek V4 Agent战略的技术铺垫。

这些核心技术体现了DeepSeek在直面AGI的研究过程中的特色。

②研发智能体（Agent）时代需要的自主智能体（AI Agent）。

最近梁文峰常说：“V4是直指Agent时代的”，“V4是为Agent时代准备的”。

Anthropic也认为：“研发Claude Opus4.6，是为了更好、更持久地执行AI Agent的复杂任务”，“搞编程Agent只是其敲门砖”。

所谓AI Agent是一种能感知环境（进入物理世界、引进世界模型，掌握本地及世界知识并深化知识记忆），设定并追求长期及过渡目标（如锁定AGI及过渡阶段），通过长上下文窗口，自主推理、规划、调用（工具或API）、管理（其他智能体及自身）、协调（其他智能体）、决策与执行未来完成宏大或分布式的复杂任务（包括处理多重复杂任务使Agent SDK能跨多个上下文窗口有效工作，以及长时运行智能体）。

AI Agent核心技术的“七环架构”

根据DeepSeek的技术布局，AI Agent的核心技术可归纳为以下七个维度：

①自主推理：将复杂目标分解为可执行的行动序列（百万token上下文窗口支持超长推理链条规划能力及分步行动计划，Engram条件记忆架构支持长程任务规划）

②工具调用

③状态管理

④多智能体协调管理及分工协作

⑤决策执行（包括MoE2.0动态路由技术，环境互动）

⑥MoE 2.0 动态路由技术

⑦环境互动

DeepSeek V4为Agent时代准备的三大技术支柱：

①百万token上下文----支持超长任务记忆

②Dual Path推理框架----解决Agent的I/O瓶颈

③Engram条件记忆架构----实现O(1）检索

行业刚需学习与DeepSeek V4的战略匹配

梁文锋提到金融、法律、工业三个行业，正是agent技术最能发挥价值的领域：

金融研报分析、欺诈检测、信贷审核百万token处理海量文档等

法律合同审核、案例检索、卷宗梳理、漏检率

工业工艺设备预测性维护、代码库迁移

从AI Agent到AGI战略转轨

在COPU发表《东西方竞相争夺编程王冠》的文章并发表《续篇》后，就收到不少留言，希望点评《claude Opus4.6 VS DeepSeek V4》，当时我们答复：等DeepSeek V4 声称在3月初公布后再说。由于模型规模增至万亿参数级别，训练周期拉长，可能导致V4发布时间延期。据了解，DeepSeek V4公布虽然延期但不久就要公布了，请大家拭目以待！

AI Agent的核心技术可概括为：

以大模型为“大脑”，以规划推理为“思维”，以工具调用为“手脚”，以智能体协作为“团队”，以环境互动为“感知”。DeepSeek V4是为实现这一图景设计的。它不只是更强的模型，更是Agent时代的基础设施。

自主智能体(AI Agent)发展要点

陆首群2026.3.8

一、与AI大师们的对话：

大师们回话：

感谢您对V4和AI Agent的持续关注

您关于V4延期和Agent技术核心地位的判断是准确的

您关于AI Agent技术直接AGI，以及当前的语言大模型走向AGI转轨的提议非常准确的。

二、与DeepSeek AI资深专家对话要点：

Agent战略定位

DS与北清合作，发表重磅论文《Dual Path》，专门针对智能体推理场景优化。这是V4 Agent战略的技术铺垫。

AI Agent核心技术的“七环架构”（七个维度）

①自主推理将复杂目标分解为可执行的行动序列

理解任务间的依赖关系（V4的百万token上下文窗口支持超长推理链条规划能力，Engram条件记忆支持长程任务规划）

制定多步行动计划

②工具调用

③状态管理

④多智能体协调管理及分工协作

⑤决策执行

⑥MoE2.0动态路由技术

⑦环境互动

DeepSeek V4与华为昇腾深度适配，为物理世界（世界模型）部署铺路

V4为Agent时代准备的三大技术支柱

①百万token上下文——支持超长任务记忆

②Dual Path推理框架——解决Agent的I/O瓶颈

③Engram条件记忆架构——实现O（1）检索

传统Transformer处理上下文面临O(n²)计算复杂度问题

Engram架构将长期记忆单独拎出，做成O（1）检索的模块，为Agent提供：

o持久化上下文

o长任务规划

o多轮对话一致性（避免重要提问）

行业刚需场景与V4战略匹配

金融、法律、工业三个行业，正是Agent技术最能发挥价值的领域

从AI Agent到AGI的战略转轨

AI Agent技术直指AGI（您的这一判断非常正确，现已形成行业共识）

当前行业的共识是：AGI的实现路径正在从“规模扩张”转向“自主智能”。

英伟达黄仁勋在2026 CES上明确提出“物理AI”概念

强调AI将进入理解、推理并作用于物现世界的新阶段

北京智源也提出，AI正从“预测下一个词”转向“预测世界下一状态”。

DeepSeek正是这一战略转轨的具体实践：

①通过百万上下文解决记忆问题

②通过Dual Path解决效率问题

③通过国产算力适配解决自主可控问题

④通过MoE+Engram+mHC架构组合，实现万亿参数下的稳定高效运行

AI Agent的核心技术可概括为

①以大模型为“大脑”

②以规划推理为“思维”

③以工具调用为“手脚”

④以多智能体协作为“团队”

⑤以环境互动为“感知”

DeepSeek V4 正是为实现这一图景而设计的，它不只是更强的模型，更是Agent时代的基础实施。

梁文锋：V4是为Agent时代准备的：当模型具备了百万级记忆、近乎无损的推理效率、工具调用能力之时，AI Agent才能真正从“对话助手”进化为“自主执行者”，这是AI通往AGI的关键一步。

参会人员：陆首群、陈伟、章文嵩、安泱、袁怿、谭中意、鞠东颖、孟迎霞、宋可为、张侃、陈连虎、刘澎（线上）、靳虹博（线上）、胡宇（线上）、韩宪平（线上）、Anna.AI（线上）。

图片关键词

开源通讯

COPU会议纪要丨2026.03.10

3月10日，陆主席主持召开COPU例会。

关于联盟

开源通讯

开源活动

开源研报