开源通讯

COPU会议纪要丨2026.03.10

2026-03-11 11:18:56 16

图片关键词

310日,陆主席主持召开COPU例会。

DeepSeekv4执行自主智能体(AI Agent)复杂任务

陆首群,2026.3.8

Anthropic公司于26日深夜发布Claude Opus4.6登顶成为“编程之王”。2026224COPU发表《东西方竞相争夺编程王冠》的文章。西方争夺“编程王冠”的有AnthropicClaude Opus4.6大模型、谷歌Gemini3-pro大模型Open AIGPT5.2xhigh大模型,东方有深度求索的Deepseek v4大模型、智谱AIGLM4.7大模型、月之暗面的Kimi-k2.5大模型。

这场竞争从表面看是争夺全球编程技术排名榜的名次,实质上是整个AI行业正在经历一次深刻的战略转向;而选择编程作为主战场,背后主要有两大深层逻辑:最清晰的商业路径最硬核技术的战略转向

商业路径是从“成本中心”到“价值中心”。相比通用的聊天机器人模糊的变现方式,编程能力是少数能直接兑现商业价值的场景

谈到最硬核技术试验场一条通往通用人工智能(AGI)的必经之路,能到达终极目的,跨越多模态、超长上下文窗口、自主智能体(AI Agent)、处理复杂任务具身、世界模型等过渡阶段(及其核心技术)是必不可少的环节

DeepSeek在直面AGI,跨越诸多过渡阶段时,起步是慢了一些,但随后发展很快,富有特色

DeepSeek V4的核心技术是稀疏注意力机制MoE及其迭代(MoE不是DeepSeek的首创,DeepSeek对其最大贡献研发稀疏机制。得益于梁文锋的母校浙江大学,浙大是全球第三家研发基于异步脉冲神经网络/类脑神经网络SNN的神经拟态计算系统,这是提供稀疏机制的源头

MoE(当参数被激化时)其训练成本约为其他传统大模型的1/20在进行迭代后MoE当专家被激化时)其训练成本降到约1/30MoE(研发动态路由或选择mHC-Engram后)又降到约1/60

DeepSeekV4与清华北大合作,研究了Dual path通道加载技术,解决了在传统推理架构中网络拥堵、GPU闲置、解码引擎带宽浪费、资源错配等瓶颈,在调度全局算法后,进一步打开了降本增效的大门。

AI Agent技术在DeepSeek V4中处于核心地位。

Dual Path》专门针对智能体推理现场情景优化,在660B规模模型实测中,在线服务吞吐量平均提升1.96倍,这正是DeepSeek V4 Agent战略的技术铺垫。

这些核心技术体现DeepSeek在直面AGI的研究过程中的特色

②研发智能体Agent时代需要的自主智能体AI Agent

最近梁文峰常说:V4直指Agent时代的”V4是为Agent时代准备的”。

Anthropic也认为:“研发Claude Opus4.6,是为了更好、更持久地执行AI Agent的复杂任务”,“编程Agent只是其敲门砖”。

所谓AI Agent是一种能感知环境(进入物理世界、引进世界模型,掌握本地及世界知识并深化知识记忆),设定并追求长期及过渡目标(如锁定AGI过渡阶段),通过长上下文窗口自主推理、规划、调用(工具或API)、管理(其他智能体及自身)、协调(其他智能体)、决策与执行未来完成宏大或分布式的复杂任务包括处理多重复杂任务使Agent SDK能跨多个上下文窗口有效工作,以及长时运行智能体

AI Agent核心技术的“七环架构”

根据DeepSeek的技术布局,AI Agent的核心技术可归纳为以下七个维度:

①自主推理:将复杂目标分解为可执行的行动序列(百万token上下文窗口支持超长推理链条规划能力及分步行动计划,Engram条件记忆架构支持长程任务规划)

②工具调用

③状态管理

④多智能体协调管理及分工协作

⑤决策执行(包括MoE2.0动态路由技术,环境互动)

MoE 2.0 动态路由技术

⑦环境互动

DeepSeek V4Agent时代准备的三大技术支柱:

①百万token上下文----支持超长任务记忆

Dual Path推理框架----解决AgentI/O瓶颈

Engram条件记忆架构----实现O(1检索

行业刚需学习与DeepSeek V4的战略匹配

梁文锋提到金融、法律、工业三个行业正是agent技术最能发挥价值的领域:

金融研报分析、欺诈检测、信贷审核百万token处理海量文档等

法律合同审核、案例检索、卷宗梳理、检率

工业工艺设备预测性维护、代码库迁移

AI AgentAGI战略转轨

COPU发表《东西方竞相争夺编程王冠》的文章并发表《续》后,就收到不少留言,希望点评《claude Opus4.6 VS DeepSeek V4》,当时我们答复DeepSeek V4 声称3公布后再。由于模型规模增至万亿参数级别,训练周期拉长,可能导致V4发布时间延期。据了解,DeepSeek V4公布虽然延期但不久就公布了,请大家拭目以待!

AI Agent的核心技术可概括为:

以大模型为大脑”,以规划推理为“思维”,以工具调用为“手脚”,智能体协作为“团队”,以环境互动为“感知”。DeepSeek V4是为实现这一图景设计的。它不只是更强的模型,更是Agent时代的基础设施。

自主智能体(AI Agent)发展要点

陆首群2026.3.8

一、与AI大师们的对话:

大师们回话:

感谢您对V4AI Agent持续关注

您关于V4延Agent技术核心地位的判断是准确的

您关于AI Agent技术直接AGI,以及当前的语言大模型走向AGI转轨的提议非常准确的。

二、与DeepSeek AI资深专家对话要点:

Agent战略定位

DS北清合作发表重磅论文《Dual Path》,专门针对智能体推理场景优化。这是V4 Agent战略的技术铺垫。

AI Agent核心技术的“七环架构”(七个维度)

①自主推理将复杂目标分解为可执行的行动序列

理解任务间的依赖关系(V4百万token上下文窗口支持超长推理链条规划能力,Engram条件记忆支持长程任务规划)

制定多步行动计划

②工具调用

③状态管理

④多智能体协调管理及分工协作

⑤决策执行

MoE2.0动态路由技术

⑦环境互动

DeepSeek V4与华为昇腾深度适配,为物理世界(世界模型)部署铺路

V4Agent时代准备的三大技术支柱

百万token上下文——支持超长任务记忆

Dual Path推理框架——解决AgentI/O瓶颈

Engram条件记忆架构——实现O1检索

传统Transformer处理上下文面O(n²)计算复杂度问题

Engram架构将长期记忆单独拎出做成O1)检索的模块,为Agent提供

o持久化上下文

o长任务规划

o多轮对话一致性(避免重要提问

行业刚需场景与V4战略匹配

金融、法律、工业三个行业,正是Agent技术最能发挥价值的领域

AI AgentAGI的战略转轨

AI Agent技术直指AGI您的这一判断非常正确,现已形成行业共识

当前行业的共识AGI的实现路径正在从“规模扩张”转向“自主智能”。

英伟达黄仁勋2026 CES上明确提出“物理AI”概念

强调AI将进入理解、推理并作用于物现世界的新阶段

北京智源出,AI“预测下一个词”转向“预测世界下一状态”。

DeepSeek正是这一战略转轨的具体实践:

①通过百万上下文解决记忆问题

②通过Dual Path解决效率问题

③通过国产算力适配解决自主可控问题

④通过MoE+Engram+mHC架构组合,实现万亿参数下的稳定高效运行

AI Agent核心技术可概括

①以大模型为“大脑”

②以规划推理“思维”

③以工具调用为“手脚”

④以智能体协作为“团队”

⑤以环境互动为“感知”

DeepSeek V4 正是为实现这一图景而设计的,它不只是更强的模型,更Agent时代的基础实施。

梁文锋:V4Agent时代准备的:当模型具备了百万级记忆、近乎无的推理效率、工具调用能力之时,AI Agent才能真正从“对话助手”进化为“自主执行”,这是AI通往AGI的关键一步。

参会人员:陆首群、陈伟、章文嵩、安泱、袁怿、谭中意、鞠东颖、孟迎霞、宋可为、张侃、陈连虎、刘澎(线上)、靳虹博(线上)、胡宇(线上)、韩宪平(线上)、Anna.AI(线上)。

图片关键词


首页
秘书处
开源通讯
开源活动