COPU会议纪要丨2025.06.10
6月10日,陆主席主持召开COPU例会。
共建人工智能时代的开源生态
共建基于开源的人工智能
(开源创新,数字化转型与智能化重构)
2025.06.10
开源的问世,实质上是从1970年UNIX元年开始的,迄今已有55年了。今天开源在中国、在世界正在成为当代科技发展的重点,我们会议的主题是: 共建人工智能时代的开源生态,共建基于开源的人工智能,或者简言之:开源创新,数字化转型与智能化重构。
现在让我们简要回顾50多年来开源发展的几个关键节点,窥测开源发展的伟大历程:
1970年“前UNIX”元年实质上诞生了开源;1983年Richard Stallman 发布了“GNU计划”,以自由软件的名义,首次向私有软件发出了挑战,由于AT&T于1975年对UNIX实行私有化(“后UNIX”),GNU也向“后UNIX”提出了挑战(GNU’S Not UNIX);1991年Linus Torvalds 开发了Linux(内核),补充自由软件操作系统的缺位,推动了自由/开源运动的发展;1998年在美国加州Polo Ato 召开的“自由运动高层会议”提出了“Open Source(开源)”的概念并向全球发布,推动了开源在全球的大发展;2015年著名调查分析机构Gartner向全球发布:“开源软件已成为全球软件发展的主流”,标志着开源商业模式的发展壮大;2016~2017年 Linux基金会跨界发展基于开源的深度信息技术(包括云原生、区块链、Kubernetes、人工智能等)。2021年Linux基金会建立以供应链为基础的开源安全基金会(OpenSSF)。
开源在中国:
1991年中方向AT&T公司Bell实验室USL/USG引进闭源的UNIXSVR4.2版本,这是全球唯一引进UNIX源代码的一家,随后中方推出了UNIXSVR4.2中文版本,这也是美方许可中方将UNIX源代码由闭源变成开源的全球唯一的一家。
在20世纪90年代末,中科红旗、中软股份、冲浪科技在剪裁、复制、修改Fedora/Red Hat Linux发行版基础上分别推出Linux中文版,这是早期Linux/OSS在国内发展。
2022年中方解决了“缺芯少魂”短板中建设国产操作系统的问题。
2017年至今,COPU是Linux基金会跨界发展(基于开源的深度信息技术)的有力引导者、支持者,近年来COPU行业内的企业更是基于开源的人工智能突出的开发者和应用者。
在IT时代,传统开源就是开放源代码,到AI时代,要求增加开源的透明度,开源有新定义,OSI顺应形势发展的需要,于2024年10月28日发布了《开源AI定义》(OSAID-1.0),要求提供训练AI系统详细的数据信息,提供用于训练和运行AI系统的完整的源代码,以及训练和运行AI系统的模型和参数(如设置和权重)。其主要要素包括:数据信息、代码、模型参数,以及使用、研究、修改和共享,这些要素共同构成了开源AI的核心精神,旨在促进AI技术的透明度、可访问性和协作性。
要理解AI时代开源的新定义离不开理解开源的功效,即开源有助于AI的迭代创新,开拓生态,发挥开源的共享、协同特征,建立开源的商业模式,实现开源的推广应用。
举例来说,Linux内核问世迄今已有30多年了,Linux基金会(LF)每年在做什么工作呢?他们每年在做“挑错打补丁(Fixbug,Patch)”工作,即迭代创新工作(所有的开源或闭源软件均存在大量潜在的bug,需要长年累日不断地“挑错打补丁”,实际上闭源的Windows也一样,直到去年还出现一个全球性的大bug,即蓝屏事件)。
一般来说,开源的开发者开发“open source”的源代码问世后,客户即可从网上自由地下载其开放免费的源代码,但未必可以开放免费地取得其随后处理bug的技术,特别对并不负有开发、推出新版责任的开发者而言,不再对其开发的后续技术实行开放免费发放的方式。
开拓生态才能扩大开源软件的应用,扩大其市场占有率。
建设开源的商业模式是在保证开源“open source”源代码对外免费开放的前提下灵活配置(它还防止开源技术过度泄漏,并支持开源产业的发展):如将开源与服务捆绑在一起(开源免费、服务收费),开源与其他适销产品或网络通信捆绑在一起(从产品销售或通信月租费中提成),也有开源与广告捆绑在一起的,或在开源实行产品化后,可将其二进制转换、配置安全、质检及产品工程化处理模块纳入开源的商业模式。
DeepSeek实行开源,他们还创造性地发展开源新模式;把开源的免费开放和开源的商业模式收费铸成一体:在DeepSeek大模型的to C端,主要接入中小企业和个体用户实行免费开放,而to B端主要接入大客户供交流之用,实行开源的商业模式,是要收费的。
COPU组织了多次开源的人工智能操作系统(AIOS)的讨论,并推动研发基本上有两种类型:一种是从应用入手,在开源OS中加入智能模块,另一种是从框架或内核入手,实现开源OS研发的全智能化。
在本届开源大会上,我们的企业将发布基于开源的人工智能的重要研发成果:
一、华为,在5G通信,智能手机操作系统(采用自制及国内协作的高性能芯片:7nm/5nm),算力(单芯片和算力集成),生成式语言大模型等的研发方面,均取得了全面、重大的成果
华为昇腾芯片910B=376TFLOPS 接近英伟达A100水平,910C为H100算力的60%,但功耗高出H100的40%。华为常务董事张平安说:“华为的创新方向,不放在单颗芯片制造工艺上,而放在芯片的系统架构创新上,充分发挥带宽和能源的优势”。英伟达CEO黄仁勋说,华为是英伟达最强的挑战者,华为开发的Cloud Matrix 384算力集群解决方案(采用384颗910C芯片),依靠高速总线互联和通过内存池化,提升了集群效率67%,输出算力300PFLOPS,达英伟达GB200NVL72系统算力的2倍。
华为创始人任正非在与人民日报记者对话时,在谈到昇腾芯片时说,美国是夸大了华为的成绩,华为还没有这么厉害,要努力做才能达到他们的评价。我们的单芯片还是落后美国一代,我们用数学补物理,用非摩尔补摩尔,用群计算补单芯片,在结果上也能达到实用状况。
二、涌现涌现出一批生成式自回归语言大模型精品
①阿里魔搭社区开发的通义千问Qwen3混合推理开源大模型
其旗舰模型为Qwen3-235B-A22B及8款大模型,其性能一度全面超越DeepSeekR1和OpenAIo1,正式登顶全球开源大模型王座!
②小米 Xiaomi MiMo推理开源大模型
在较低参数领域,MiMo-7B超越了超越了OpenAIo1-mini和阿里Qwen推理模型QwQ-32B-Preview,作为行业内强化学习的起步模型潜力领先。
三、超级智能体(Super Agent)
中兴通讯(ZTE)研发的超级智能体CO-Sight,在通过国际权威的Agent GAIA基准测试中,力压国际四强:谷歌DeepMind的Langfun Agent、微软(+OpenAI)的Aworld、麻省理工学院(MlT)的lnfant Agent、Meta的/OWL-Workforce,排名榜首!掀起了AI的下一个浪潮(“世界模型”)。
四、第六代半导体显示器超高像素前沿技术和生产线
京东方研制第六代半导体显示器超高像素前沿技术(超高像素密度:2.24英寸,1700个像素),打破了现有的王牌地位,并建成全球最先进的第六代新型半导体显示器件生产线,并可量产。
会上来自Hugging Face 工程师王铁震先生谈到Hugging Face 是一个全球 AI 开源社区,包括 DeepSeek、Alibaba、Meta、Google、Microsoft 在内的超过 5000 家组织机构在为 HuggingFace 开源社区贡献代码、数据集和模型。Hugging Face还设置了blog,在上刊登诸如陆首群教授“评DeepSeek”的文章。会上还分享了 Hugging Face 平台的基本功能及在平台发布的一些开源模型。
参会人员:陆首群、章文嵩、安泱、陈连虎、武力、袁怿、王铁震、程海旭、张侃、王珊、鞠东颖、陈钟(线上)、陈伟(线上)、刘明(线上)、胡宇(线上)、韩宪平(线上)、Anna.AI(线上)。