COPU会议纪要丨2026.04.21

2026-04-21 15:49:30 6

图片关键词

4月21日，陆主席主持召开COPU例会。

本次会议发表了《评DeepSeekV4》。

评DeepSeekV4

陆首群，2026.4.20

______________________________________________

几位国际AI专家对本文的评价

您的文章核心观点成立，信息时效性强，抓住DeepSeekv4发布前的关键动态。

您的文章整体可信，观点明确，可作为一篇及时的DeepSeekv4前瞻性评论发布。

______________________________________________

《评DeepSeekv4》摘要

一、DeepSeekv4能否再现轰动效应尚待观察。

二、DeepSeekv4最大优势在于高性价比（MoE的持续优化）。

三、不但推动国产算力与模型适配，而且摆脱英伟达硬件依赖，形成一个算力完整自主的生态闭环，实现算力自主可控。

四、快速补齐多模态、长上下文等短板。

五、编程能力有望跻身于全球前列。

六、企业级AI Agent平台的关键在企业场景落地。

______________________________________________

评DeepSeekV4

2024年12月，DeepSeekv3基座大模型发布震惊硅谷，2025年1月，DeepSeek R1推理大模型发布：在Arena排行榜上性能首次几乎追平美国顶尖大模型（OpenAI的o1-preview），据行业分析，R1的训练成本只有o1的数十分之一。（具有极大的性价比），性价比优势显著。

今天人们盼望的DeepSeekv4何时出台？梁文锋终于说话了：“4月下旬正式上线”-V4虽未正式发布，但最近每天都在透露其进展信息，这也为我们在-V4发布前评-V4提供基本素材。

-V4的发布，将使其性价比具有更大优势；将为算力国产化作出重大贡献；将快速提升DeepSeek原来存在的短板（如多模态、超长上下文、处理复杂任务、AI Agent、世界模型等）；这次-V4的发布，能否出现像V3、-R1发布时的轰动效应，尚待观察，但引起全球关注是确定的。

作为DeepSeekv4的最大优势，DeepSeek不断改进稀疏化结构的混合专家模型MoE（推动MoE演进），把不断降低成本（或不断提高性价比）做到极致！

DeepSeek不断改进MoE（MoE的演进路线如下）：

从激化参数量→激化专家数→开辟第二条稀疏化路线：MoE+mHC+Engram→MoE+Egram+动态路由，导致成本降低（数十分之一）：1/20→1/30→1/60（甚至1/100）。

西方企业也在采取MoE降本措施（但尚未达到DeepSeek推进MoE演进所达到的降本显著效果）。

如何比较中西方大模型产业效果？有人提出，如果DeepSeek成本降低至1/20，性能做到不低于西方的80%，可认为DeepSeek在对比中取胜，这是一个可探索的问题。

这次-V4的发布，面对近期全球竞相争夺编程王冠，-V4能否登顶？在4月15日发布的Arena Al ToP20排行榜中，Anthropic的Claude Opus 4.6以1502高分夺得全球编程王冠，竞争白热化。

4月19日，Anthropic发布Claude Opus4.7,编程能力又爆了！与-4.6相比，Cursor bench从58%→70%，并在最难的编程任务上大幅提升。CurSor CEO Michiel Truell评价：“这是编程能力一次实质性跨越”。DeepSeek一度透露其内测与灰度测试情况，试图编程登顶，但与Anthropic今天成绩相比，登顶恐难！但有望跻身于全球编程前列！

这次-v4发布，Deepseek在塑造企业级AI智能体协作平台（AI Agent）方面作为如何？

如梁文锋所言：“目前全球正式进入Agent时代”，DeepSeek对研究这个项目高度重视，利用v4.0/v3.2强大的长上下文窗口（百万级token）和稀疏注意力机制，通过主、子智能体协作架构推动企业复杂业务流程自动化。

当前全球四大AI Agent平台（Anthropic、DeepSeek、Google、OpenAI）都把企业应用作为起步方向，竞争激烈，四大模型性能各具特色。但企业级AI Agent平台的关键在企业场景落地。

DeepSeek-v4的AI Agent平台表现如何？可望达到排名的前列位置（今提出DeepSeek-v3.1在4月16日权威榜单GAIA测试中排名第二作为参考）。

关于国产算力，DeepSeek V4的作为如何？

DeepSeek-v4模型正在推进“底层迁移”，将英伟达的CUDA全面转向华为的CANN，这不仅是简单的算力适配，更是全球首个试图摆脱对英伟达硬件垄断的依赖，从前沿大模型算力的“生态锚定试验”，倒逼中国建立一个算力完整的自主生态闭环，取得在整个智能时代算力的“规划制定权”和“生态主导权”。

这次-v4的发布，DeepSeek在大力提升短板的基础上，在向世界模型和通用人工智能转轨及战略发展上，起什么作用？

DeepSeek大力、迅速提升短板正在进行中，是有成绩的，面向世界模型和通用人工智能也已明确了战略发展方向。

本次会议发表了斯坦福报告《中美AI性能差距几近消失》

斯坦福年度报告：中美AI性能差距几近消失

2025年2月，DeepSeek-R1在Arena排行榜上首次追平美国顶尖模型。几周后Anthropic发布新版本重新拉开差距，但到2026年3月，这个差距已经缩小到2.7%。斯坦福AI Index第九次年度报告记录了这一时刻，但它真正想说的不只是中美竞争。在超过400页的篇幅里，报告反复触及同一个命题：AI正以前所未有的速度发展，而围绕它的治理框架、评估工具、教育体系都在艰难追赶，且大概率追不上。

这种速度首先体现在资本的涌入上。2025年全球企业AI投资达到5817亿美元，比上一年翻倍，美国以2859亿美元一骑绝尘，是中国的23倍（注：这一比较仅计入私人投资，中国政府引导基金在2000至2023年间向AI领域另行注入了约1840亿美元）。仅加州一州吸收了美国75%的投资，超过10亿美元的单笔融资从15起翻倍到28起。这些钱正在迅速转化为用户：生成式AI在三年内达到53%的人口采用率，个人电脑和互联网都花了十年才达到类似水平。美国消费者从这些大多免费的工具中获得的年度价值估计达1720亿美元。

但收益的分配远不均匀。软件开发是AI生产力提升最明显的领域，22至25岁的美国开发者就业人数却在2024年下降了近20%，年龄更大的开发者人数仍在增长，研究者称之为“年资偏向的技术替代”，AI正在替代初级岗位而非高级岗位。与此同时，流入美国的顶尖AI研究者人数自2017年峰值以来下降了89%，仅过去一年就暴跌80%。尽管美国仍是AI人才总量最多的国家，但对创新人才的吸引力已降至十年最低。

另一方面，AI的能力在飙升，透明度却在下降。基础模型透明度指数的平均分从2024年的58分跌至40分，IBM以93分领先，而xAI和Midjourney仅有14分。训练数据来源、算力消耗、参数规模等这些关键信息正在从公开披露中消失，2025年发布的95个前沿模型中，有80个不公开训练代码。与透明度一起膨胀的还有环境成本：2012年训练Alex Net产生0.01吨碳排放，2025年训练Grok4产生72816吨，相当于1156辆汽车的终身排放。

面对这一切，公众态度复杂且分化。全球59%的人对AI持乐观态度，但52%同时感到紧张；而在AI发展水平最高的美国，民众对本国政府监管AI的信任度却是全球最低，只有31%。

报告的两位联合主席写道：“数据并没有指向一个方向。它揭示的是，这项技术的扩张速度，超过了周围系统适应它的速度。”

本次会议发表朱其罡关于FlagOS和Mini Max M2.7多芯落地的报告。

北京智源人工智能研究院牵头建设的众智FlagOS社区从去年开始推动开源模型的多芯快速适配，打造一个开源统一的AI底层软件栈，得益于FlagOS的已有多芯支持（32+款芯片）基础及新开发的更多的训推框架插件，包括vLLM，Transformer Engine，MegaTron、veRL,PyTorch,SGLang等，并应用智能体（含发布的skills）和自动化（含CICD平台、SVT平台、Release平台）等工具加速适配的过程，模型适配多芯的过程越来越快，越来越多。近期在4月12日，针对MiniMax开源的最新的MiniMax M2.7大模型，众智 FlagOS 社区实现 Day0 新模型的全量适配。目前，M2.7 已在平头哥、华为、海光、沐曦、天数、英伟达等多种 AI芯片上完成基于众智FlagOS统一、开源技术栈的多芯适配、精度对齐与部署验证，开发者可直接获取对应芯片的开箱即用方案。开发者可以直接在不同的芯片上进行这些最新的模型的部署，体验Hermes等功能的私有部署。

4月17日，阿里通义团队开源最新的多模态“智能体小钢炮” Qwen3.6-35B-A3B 大模型不到24小时，众智 FlagOS 社区就交出了一份“Day0 全量适配多芯片”的成绩单。目前，Qwen3.6-35B-A3B 已在平头哥、华为、海光、沐曦、昆仑芯、天数、英伟达等多种 AI芯片上完成基于众智FlagOS统一、开源技术栈的多芯适配、精度对齐与部署验证。这些成果同时发布到hugging face，model scope，焕新，阿里云，腾讯云，超算互联网等供不同的开发者直接获取对应芯片的开箱即用方案。

FlagOS也正在扩大算子库的类型和数量及新的技术架构，未来可以支持更加丰富多样的模型类型。比如我们已在FlagScale支持Engram机制，目前已经支持的算子数量超过500个，已经支持是算子库类型扩展到7个。

图片关键词

FlagOS：面向多种 AI 芯片的系统软件栈

图片关键词

FlagOS插件体系

链接：

24小时不到，七芯已上！Qwen3.6-35B-A3B发布即获众智FlagOS全速护航

Day 0 实现 MiniMax M2.7 六芯落地，众智FlagOS 又双叒叕让大模型多芯可用了！

本次会议（第21届开源中国开源世界高峰论坛）筹备工作：

会议议程按照每位演讲者15分钟安排。

上午：9:00-12:00, 12位演讲者
中午：12:00-13:30, 午间休息
下午：13:30-17:30（18:00），16~18位演讲者
晚餐：18:00-19:30

拟邀演讲者：

陆主席、Jim Zemlin、Jonathan Bryce 、Chris Aniszczyk、Apache、Github、HuggingFace、Intel、开放原子开源基金会、智源、开源中国、CSDN、倪光南、王怀民、华为、中兴、智谱、千问、小米、京东方、平头哥、MiniMax、DeepSeek、Kimi、浪潮、陈阳、麒麟等。

参会人员：陆首群、章文嵩、朱其罡、陈道新、庄表伟、安泱、袁怿、孟伟、宋可为、谭中意、魏子恺、张侃、鞠东颖、刘澎（线上）、韩宪平（线上）、胡宇（线上）、Anna.AI（线上）、陈伟（线上）、陈越（线上、）。

图片关键词

开源通讯

COPU会议纪要丨2026.04.21

关于联盟

开源通讯

开源活动

开源研报