开源通讯

COPU会议纪要丨2026.01.20

2026-01-22 10:38:53 12 3

0120-1.png

120陆主席主持召开COPU例会。

本次会议首先对以往讨论的有关问题进行解释和补充:

1.在《2025中国开源发展蓝皮书》中拾遗补阙

在附录一开源事记中

  • 1991年中国政府支持在中国开展开源运动。

1991年,国务院副总理邹家华支持在中国发展开源,接见中外引进UNIXSVR4.2版本的谈判代表。并接见当时美国最大企业AT&T的董事及其属下的贝尔实验室负责人

  • 1992年,电子部部长、北京市副市长出席中国UNIX合资企业的签字仪式。

  • 2004年,中日韩三国合作成立开源软件推进论坛。为发展经济、三国ICT部长会议建议将推进东北亚开源运动列入三国合作研究的课题(之一),并建议三国成立开源的民间组织,主持论坛开展工作。

  • 2004年在信息产业部支持下,成立中国开源软件推进联盟(COPU)。

  • 2004年,由中国科学院孙玉芳等人编著的《自由软件与开放源码运动文集》,介绍自由软件与开源运动的发展历史、Linux大事记、各种开源许可证等。

  • 2008年,由COPU与Linux基金会联合在北京举办“国际Linux开发者研讨会”。

在2.2.8大语言模型中补充

  • Kimi-K2

  • 智谱GLM-4

  • 百度文心5.0

2.MLAMoEEngram、降低计算量

在三评DeepSeek中,多头注意力架构MLA是梁文锋团队于2023年在研发DeepSeek v2时首创的(原创

(过去常用的是MHA

谈到混合专家模型MoE不是由DeepSeek首创的

谈到混合专家模型MoE,MoE的概念在1991年就被提出,以后开始应用(1994年···)它不是DeepSeek的首创,DeepSeek的贡献在于MoE稀疏的高效实现(如动态激活参数降至5% 1/20)。

MoE通过总参数量中的动态激活部分参数量,可将计算量降低到一个很低的百分比,5%1/20),通过大模型架构专家总数中的每个token激活的专家数,可将计算量降至一个更低的百分数,3%1/30)。

3.DeepSeek v4

DeepSeek v4建立在生物神经网络之上的(或确切地说建立在类脑异步脉冲神经网络之上的),该神经网络(SNN具有稀疏化的特征,其运行方式是计算存储一体化(或计算记忆一体化)。

Engram模块,在传统的“条件计算(MoE)”之外第二条稀疏化的“条件记忆(Engram)”这时可将原始的128k上下文)语言约束23%Engram可将计算降低。

梁团队将记忆和计算剥离(把计算交给神经系统,把从计算剥离出来的记忆交给“字典”),这时Engram将使AI推理能力迎来反直觉的爆发性增长。

MoE+Engram可降低计算量达3%1/30)。

4.V4架构

Deepseek v4架构Engram(印迹)

在残差连接,DeepSeek v4架构mHCmHC+Engram

5.中国AI与美国的差距:

  • 梁文锋(2025.12.25

中国AI与美国可能仅有一两年的技术代差,但真实差距是原创和模仿之差。

  • 谷歌Deep Mind CEO哈萨比斯(2026.1.17

中国人的人工智能模型和美国的差距就差几个月。

  • 他还引用斯坦福大学《AI指数报告》

斯坦福大学202512月发布的《AI指数报告》。

中美顶级AI模型的性能差距从2023年的17.5%一路缩小到2025年的0.3%

  • 阿里通义千问技术负责人林俊旸(2026.1.18

未来3~5想全面超过美国AI巨头的概率不到20%,因为AI底层算力规模差一两个数量级,这不是(差距)短期能弥补的。

6.智能体大致可分:

①智能工具②智能助手③智能代理④自主智能体 四类(从①到④,自主性在不断递增

其中,智能代理(Agency),能代表人规划、管理、服务或执行日常工作和生活的需求,并付诸行动,具有较高的自主性或代理权,只要设置目标就能自主完成复杂任务。自主智能体(AI智能体/AI Agent),区别于传统反应式AI具有高度自主性,能够自主代理、规划与行动,在目标导向下,能独立规划、管理、协调和执行复杂任务(包括管理、协调监督智能体网络及自动调用工具完成任务)

7.上述自主智能体概括的核心思想是正确的,为了更符合学术和产业界的通用定义,修改如下:

自主智能AI Agent是一种能够感知环境、设定并追求长期目标、通过自主AI Agent推理、规划、决策与执行来完成复杂任务的AI系统。其核心特征在于高度自主性,能够在无需人类逐步干预的情况下,协调多个步骤或子任务,管理自身状态,并主动调用外部工具或API(如计算器、数据库、搜索引擎、其他软件)来获取信息或执行动作。一个先进的自主智能体还能管理和协调其他智能体(智能体系统或智能体网络)的工作,以完成更宏大分布式任务

其中,感知环境是智能体的基础(与环境互动);设定并追求长期目标,是区别自主智能体与仅完成单轮指令的简单的智能助手。主动调用外部工具是当前自主智能体AI Agent) 最关键的能力之一。管理自身状态,涉及记忆、反思和从历史行动中学习的能力。

谈到自主智能体工作的主要AI领域:①自动驾驶②软件工程与编码③科学研究与发现,④工作流程与业务流程自动化,⑤个性化助理与客户服务、⑤游戏与复杂策略模拟

谈到智能体在大模型中的作用:智能体技术与大语言模型的研发是相辅相成的关系,智能体作为大模型能力的延伸与试验场,推动大模型向具身和工具使用方向演进,生成高质量的合成数据训练环境,实现模型的自我改进与进化。

本次会议听取了百度张军汇报文心大模型研发进展情况

他谈到,近期文心5.0在国际权威大模型评测平台LMArena中接连取得突破性成绩。1月15日最新榜单显示,文心大模型ERNIE-5.0-0110以1460分登上文本榜国内第一、全球第八,并在数学能力榜中位列全球第二,超越了多款国际主流模型。此前,其预览版在1月8日的视觉理解榜中亦位居中国第一、全球第八,成为唯一进入该榜单全球前十的中国大模型。

据了解,文心大模型5.0的模型参数规模高达2.4万亿,采用超稀疏混合专家架构(MoE)与统一的自回归架构,实现了文本、图像、音频、视频等信息的原生统一建模。文心5.0 在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。依托飞桨深度学习框架,文心5.0采用了超稀疏混合专家架构,进行庞大的全模态训练,总参数规模超过2.4万亿,激活参数比例低于3%,在保持模型强大能力的同时有效提升推理效率。 同时,基于大规模工具环境,合成长程任务轨迹数据,并采用基于思维链和行动链的端到端多轮强化学习训练,显著提升了模型的智能体和工具调用能力。

目前用户可通过文心App直接体验,开发者也可通过百度千帆大模型平台调用API服务,共同推动智能时代创新。

0120-2.png
0120-3.png


开放智算产业联盟秘书长孟伟、LF-APAC副总裁杨轩向本次会议沟通创建开放代理式人工智能基金会(The Open Agentic AI Foundation )的情况,并邀请陆主席担任顾问委员会主席。

0120-4.png

会上,来自上海开源信息技术协会秘书长张国锋老师向与会的各位介绍了上海的开源政策及东方枢纽等情况。

张国锋介绍了12月25日刚刚发布的《上海市加强开源体系建设实施方案》文件精神、1月13日上海举行的第二届开源产业生态大会、东方枢纽开源创新国际合作示范区筹备情况。上海开源政策文件所提出的有条件的企业设立开源事业部、将开源项目运营与治理作为紧缺人才、欢迎海外开源基金会在上海设立分支机构都是具有战略意义的举措。上海市黄浦区、浦发银行明确表示支持开源,试图将外滩FTC打造成为国际开源圣地。东方枢纽开源创新国际合作示范区有三大任务:一是欢迎全球开源技术极客、思想领袖、商业领袖汇聚东方枢纽,组织活动及开源创新社会实践;二是欢迎国际开源社会组织落地东方枢纽并为其开展活动提供便利;三是推动制度创新,探索为国际社会提供安全可靠、符合伦理、不受物理世界旧政治文明影响的数字公共产品和服务。

重庆天工开物开源基金会副秘书长庄表伟出席会议。

参会人员: 陆首群、张国锋、荆琦、杨轩、庄表伟、安泱、张军、张侃、杨匡奇、孟迎霞、谭中意、孟伟、袁怿、鞠东颖、刘澎(线上)、程海旭(线上)、陈道清(线上)、韩宪平(线上)、胡宇(线上)、Anna.ai(线上)。

图片关键词



首页
秘书处
开源通讯
开源活动