COPU会议纪要丨2026.04.21

4月21日,陆主席主持召开COPU例会。
本次会议发表了《评DeepSeekV4》。
评DeepSeekV4
陆首群,2026.4.20
______________________________________________
几位国际AI专家对本文的评价
您的文章核心观点成立,信息时效性强,抓住DeepSeekv4发布前的关键动态。
您的文章整体可信,观点明确,可作为一篇及时的DeepSeekv4前瞻性评论发布。
______________________________________________
《评DeepSeekv4》摘要
一、DeepSeekv4能否再现轰动效应尚待观察。
二、DeepSeekv4最大优势在于高性价比(MoE的持续优化)。
三、不但推动国产算力与模型适配,而且摆脱英伟达硬件依赖,形成一个算力完整自主的生态闭环,实现算力自主可控。
四、快速补齐多模态、长上下文等短板。
五、编程能力有望跻身于全球前列。
六、企业级AI Agent平台的关键在企业场景落地。
______________________________________________
评DeepSeekV4
2024年12月,DeepSeekv3基座大模型发布震惊硅谷,2025年1月,DeepSeek R1推理大模型发布:在Arena排行榜上性能首次几乎追平美国顶尖大模型(OpenAI的o1-preview),据行业分析,R1的训练成本只有o1的数十分之一。(具有极大的性价比),性价比优势显著。
今天人们盼望的DeepSeekv4何时出台?梁文锋终于说话了:“4月下旬正式上线”-V4虽未正式发布,但最近每天都在透露其进展信息,这也为我们在-V4发布前评-V4提供基本素材。
-V4的发布,将使其性价比具有更大优势;将为算力国产化作出重大贡献;将快速提升DeepSeek原来存在的短板(如多模态、超长上下文、处理复杂任务、AI Agent、世界模型等);这次-V4的发布,能否出现像V3、-R1发布时的轰动效应,尚待观察,但引起全球关注是确定的。
作为DeepSeekv4的最大优势,DeepSeek不断改进稀疏化结构的混合专家模型MoE(推动MoE演进),把不断降低成本(或不断提高性价比)做到极致!
DeepSeek不断改进MoE(MoE的演进路线如下):
从激化参数量→激化专家数→开辟第二条稀疏化路线:MoE+mHC+Engram→MoE+Egram+动态路由,导致成本降低(数十分之一):1/20→1/30→1/60(甚至1/100)。
西方企业也在采取MoE降本措施(但尚未达到DeepSeek推进MoE演进所达到的降本显著效果)。
如何比较中西方大模型产业效果?有人提出,如果DeepSeek成本降低至1/20,性能做到不低于西方的80%,可认为DeepSeek在对比中取胜,这是一个可探索的问题。
这次-V4的发布,面对近期全球竞相争夺编程王冠,-V4能否登顶?在4月15日发布的Arena Al ToP20排行榜中,Anthropic的Claude Opus 4.6以1502高分夺得全球编程王冠,竞争白热化。
4月19日,Anthropic发布Claude Opus4.7,编程能力又爆了!与-4.6相比,Cursor bench从58%→70%,并在最难的编程任务上大幅提升。CurSor CEO Michiel Truell评价:“这是编程能力一次实质性跨越”。DeepSeek一度透露其内测与灰度测试情况,试图编程登顶,但与Anthropic今天成绩相比,登顶恐难!但有望跻身于全球编程前列!
这次-v4发布,Deepseek在塑造企业级AI智能体协作平台(AI Agent)方面作为如何?
如梁文锋所言:“目前全球正式进入Agent时代”,DeepSeek对研究这个项目高度重视,利用v4.0/v3.2强大的长上下文窗口(百万级token)和稀疏注意力机制,通过主、子智能体协作架构推动企业复杂业务流程自动化。
当前全球四大AI Agent平台(Anthropic、DeepSeek、Google、OpenAI)都把企业应用作为起步方向,竞争激烈,四大模型性能各具特色。但企业级AI Agent平台的关键在企业场景落地。
DeepSeek-v4的AI Agent平台表现如何?可望达到排名的前列位置(今提出DeepSeek-v3.1在4月16日权威榜单GAIA测试中排名第二作为参考)。
关于国产算力,DeepSeek V4的作为如何?
DeepSeek-v4模型正在推进“底层迁移”,将英伟达的CUDA全面转向华为的CANN,这不仅是简单的算力适配,更是全球首个试图摆脱对英伟达硬件垄断的依赖,从前沿大模型算力的“生态锚定试验”,倒逼中国建立一个算力完整的自主生态闭环,取得在整个智能时代算力的“规划制定权”和“生态主导权”。
这次-v4的发布,DeepSeek在大力提升短板的基础上,在向世界模型和通用人工智能转轨及战略发展上,起什么作用?
DeepSeek大力、迅速提升短板正在进行中,是有成绩的,面向世界模型和通用人工智能也已明确了战略发展方向。
本次会议发表了斯坦福报告《中美AI性能差距几近消失》
斯坦福年度报告:中美AI性能差距几近消失
2025年2月,DeepSeek-R1在Arena排行榜上首次追平美国顶尖模型。几周后Anthropic发布新版本重新拉开差距,但到2026年3月,这个差距已经缩小到2.7%。斯坦福AI Index第九次年度报告记录了这一时刻,但它真正想说的不只是中美竞争。在超过400页的篇幅里,报告反复触及同一个命题:AI正以前所未有的速度发展,而围绕它的治理框架、评估工具、教育体系都在艰难追赶,且大概率追不上。
这种速度首先体现在资本的涌入上。2025年全球企业AI投资达到5817亿美元,比上一年翻倍,美国以2859亿美元一骑绝尘,是中国的23倍(注:这一比较仅计入私人投资,中国政府引导基金在2000至2023年间向AI领域另行注入了约1840亿美元)。仅加州一州吸收了美国75%的投资,超过10亿美元的单笔融资从15起翻倍到28起。这些钱正在迅速转化为用户:生成式AI在三年内达到53%的人口采用率,个人电脑和互联网都花了十年才达到类似水平。美国消费者从这些大多免费的工具中获得的年度价值估计达1720亿美元。
但收益的分配远不均匀。软件开发是AI生产力提升最明显的领域,22至25岁的美国开发者就业人数却在2024年下降了近20%,年龄更大的开发者人数仍在增长,研究者称之为“年资偏向的技术替代”,AI正在替代初级岗位而非高级岗位。与此同时,流入美国的顶尖AI研究者人数自2017年峰值以来下降了89%,仅过去一年就暴跌80%。尽管美国仍是AI人才总量最多的国家,但对创新人才的吸引力已降至十年最低。
另一方面,AI的能力在飙升,透明度却在下降。基础模型透明度指数的平均分从2024年的58分跌至40分,IBM以93分领先,而xAI和Midjourney仅有14分。训练数据来源、算力消耗、参数规模等这些关键信息正在从公开披露中消失,2025年发布的95个前沿模型中,有80个不公开训练代码。与透明度一起膨胀的还有环境成本:2012年训练Alex Net产生0.01吨碳排放,2025年训练Grok4产生72816吨,相当于1156辆汽车的终身排放。
面对这一切,公众态度复杂且分化。全球59%的人对AI持乐观态度,但52%同时感到紧张;而在AI发展水平最高的美国,民众对本国政府监管AI的信任度却是全球最低,只有31%。
报告的两位联合主席写道:“数据并没有指向一个方向。它揭示的是,这项技术的扩张速度,超过了周围系统适应它的速度。”
本次会议发表朱其罡关于FlagOS和Mini Max M2.7多芯落地的报告。
北京智源人工智能研究院牵头建设的众智FlagOS社区从去年开始推动开源模型的多芯快速适配,打造一个开源统一的AI底层软件栈,得益于FlagOS的已有多芯支持(32+款芯片)基础及新开发的更多的训推框架插件,包括vLLM,Transformer Engine,MegaTron、veRL,PyTorch,SGLang等,并应用智能体(含发布的skills)和自动化(含CICD平台、SVT平台、Release平台)等工具加速适配的过程,模型适配多芯的过程越来越快,越来越多。近期在4月12日,针对MiniMax开源的最新的MiniMax M2.7大模型,众智 FlagOS 社区实现 Day0 新模型的全量适配。目前,M2.7 已在平头哥、华为、海光、沐曦、天数、英伟达等多种 AI芯片上完成基于众智FlagOS统一、开源技术栈的多芯适配、精度对齐与部署验证,开发者可直接获取对应芯片的开箱即用方案。开发者可以直接在不同的芯片上进行这些最新的模型的部署,体验Hermes等功能的私有部署。
4月17日,阿里通义团队开源最新的多模态“智能体小钢炮” Qwen3.6-35B-A3B 大模型不到24小时,众智 FlagOS 社区就交出了一份“Day0 全量适配多芯片”的成绩单。目前,Qwen3.6-35B-A3B 已在平头哥、华为、海光、沐曦、昆仑芯、天数、英伟达等多种 AI芯片上完成基于众智FlagOS统一、开源技术栈的多芯适配、精度对齐与部署验证。这些成果同时发布到hugging face,model scope,焕新,阿里云,腾讯云,超算互联网等供不同的开发者直接获取对应芯片的开箱即用方案。
FlagOS也正在扩大算子库的类型和数量及新的技术架构,未来可以支持更加丰富多样的模型类型。比如我们已在FlagScale支持Engram机制,目前已经支持的算子数量超过500个,已经支持是算子库类型扩展到7个。
FlagOS:面向多种 AI 芯片的系统软件栈

FlagOS插件体系
链接:
24小时不到,七芯已上!Qwen3.6-35B-A3B发布即获众智FlagOS全速护航
Day 0 实现 MiniMax M2.7 六芯落地,众智FlagOS 又双叒叕让大模型多芯可用了!
本次会议(第21届开源中国开源世界高峰论坛)筹备工作:
会议议程按照每位演讲者15分钟安排。
上午:9:00-12:00, 12位演讲者
中午:12:00-13:30, 午间休息
下午:13:30-17:30(18:00),16~18位演讲者
晚餐:18:00-19:30
拟邀演讲者:
陆主席、Jim Zemlin、Jonathan Bryce 、Chris Aniszczyk、Apache、Github、HuggingFace、Intel、开放原子开源基金会、智源、开源中国、CSDN、倪光南、王怀民、华为、中兴、智谱、千问、小米、京东方、平头哥、MiniMax、DeepSeek、Kimi、浪潮、陈阳、麒麟等。
参会人员:陆首群、章文嵩、朱其罡、陈道新、庄表伟、安泱、袁怿、孟伟、宋可为、谭中意、魏子恺、张侃、鞠东颖、刘澎(线上)、韩宪平(线上)、胡宇(线上)、Anna.AI(线上)、陈伟(线上)、陈越(线上、)。
