COPU会议纪要丨2025.06.03
6月3日,陆主席主持召开COPU例会。
陆主席表示欢迎Huggingface王铁震工程师参加COPU例会,并感谢他帮助陆主席的一篇文章“评DeepSeek”登上Huggingface(全球研发的著名大模型如:DeepSeekR1、Qwen3等也在Huggingface上发表)。
本次例会发表陆主席拟在开源大会上发表的报告,请大家审查提出修改意见:
以AI时代开源新定义改造AIOS,发展基于开源的AI
陆首群 2025.05.06
在IT时代,传统开源就是开放源代码,到AI时代,要求增加开源的透明度,开源有新定义,OSI顺应形势发展的需要,于2024年10月28日发布了《开源AI定义》(OSAID-1.0),要求提供训练AI系统详细的数据信息,提供用于训练和运行AI系统的完整的源代码,以及训练和运行AI系统的模型和参数(如设置和权重)。其主要要素包括:数据信息、代码、模型参数,以及使用、研究、修改和共享,这些要素共同构成了开源AI的核心精神,旨在促进AI技术的透明度、可访问性和协作性。
要理解AI时代开源的新定义离不开理解开源的功效,即开源有助于AI的迭代创新,开拓生态,建立开源的商业模式,实现开源的推广应用。
举例来说,Linux内核问世迄今已有30多年了,Linux基金会(LF)每年在做什么工作呢?他们每年在做“挑错打补丁(Fixbug,Patch)”工作,即迭代创新工作(所有的开源或闭源软件均存在大量潜在的bug,需要长年累日不断地“挑错打补丁”,实际上闭源的Windows也一样,直到去年还出现一个全球性的大bug,即蓝屏事件)。
一般来说,开源的开发者开发“open源代码向世后,客户即可从网上自由地下载其开放免费的源代码,但未必可以开放免费地取得其随后处理bug的技术,特别对并不负有开发、推出新版责任的开发者而言,不再对其开发的后续技术实行开放免费发放的方式。
开拓生态才能扩大开源软件的应用,扩大其市场占有率。就手机而言,鸿蒙手机由于受到美国政府无理打压,丧失了美欧生态领域,在全球手机市场上,华为去年手机销售暂时未能进入前五位。我欣赏华为的韧性,但攻克全球生态还是一场硬仗!(我并不认为开发手载消费品的生态完全可以替代地域市场的生态)。
建设开源的商业模式是在保证开源open源代码对外免费开放的前提下灵活配置(它还防止开源技术过度泄漏,并支持开源产业的发展):如将开源与服务捆绑在一起(开源免费、服务收费),开源与其他适销产业或网络通信捆绑在一起(从产品销售或通信月租费中提成),也有开源与广告捆绑在一起的,或在开源实行产品化后,可将其二进制转换、配置安全、质检及产品工程化处理模块纳入开源的商业模式。
DeepSeek实行开源,他们还创造性地发展开源新模式;把开源的免费开放和开源的商业模式收费铸成一体:在DeepSeek大模型的to C端,主要接入中小企业和个体用户实行免费开放,而to B端主要接入大客户供交流之用,实行开源的商业模式,是要收费的。
COPU组织了多次开源的人工智能操作系统(AIOS)的讨论,基本上有两种类型:一种是从应用入手,在开源OS中加入智能模块,另一种是从框架或内核入手,实现开源OS研发的全智能化。
在今年6月13-14日举行的《第20届开源中国开源世界大会》上:
陆主席谈:华为是一家具有创新成就的科技企业,不幸它被人家特别“照顾”,不准它向世界购买芯片(特别是高性能芯片)。在这种情况下,华为怎么办?华为是如何解决自制高性能芯片的?
华为常务董事张平安先生作出了回答;他说:华为的创新方向,不放在单颗芯片的制造工艺上,而是放在芯片的系统架构创新上,充分发挥带宽和能源的优势,用空间(系统架构、带宽)的能力和能源的优势,换取芯片工艺的不足。
英伟达CEO黄仁勋最近多次公开讲话,他认为华为是英伟达最强劲的竞争对手,他还用具体事例证实了张平安先生的说法。
他说,华为的910C单颗芯片的算力为英伟达H100的60%,功耗高出H100的40%,但华为开发的Cloud Matrix384 AI算力集群解决方案(384颗910C芯片),以384卡高速总线互连的庞大规模,华为通过内存池化和高速总线架构提升了集群效率67%,输出算力可达300 PFLOPS,超过了英伟达最新的Grace Black Well系统/接近达到英伟达GB200NVL72系统算力的两倍。
向这次大会推出的一批COPU行业内基于开源的人工智能的精品有:
一、华为,高性能芯片的系统架构创新,开源!
二、 ①阿里魔搭社区开发的通义千问Qwen3混合推理大模型,开源!
全部8款(旗舰模型Qwen3-235B-A22B,以及Qwen3-30B-A3B;以及6个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B),支持Apache2.0协议开源、119种语言、Agent能力及MCP协议,“快思慢想”按需切换。阿里Qwen3性能全面超越DeepSeekR1和OpenAIo1,正式登顶全球开源大模型王座!
②小米 Xiaomi MiMo推理大模型,开源!
小米XiaomiMiMo推理大模型,开源!在数学推理(AlME24-25)和代码竞赛(LiveCodeBenchv5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的o1-mini和阿里Qwen更大规模的推理模型QwQ-32B-Preview。
在行业内,DeepSeek-R1-Distill-7B和Qwen2.55-32B已成为广泛使用的强化学习的起步模型。在相同RL训练数据情况下,MiMo的数学&代码领域强化学习潜力显著领先。
三、研制超级智能体(Super Agent)
中兴通讯(ZTE)研发的超级智能体(SuperAgent)CO-Sight,在通过国际权威的Agent GAIA基准测试中,力压国际四强:谷歌DeepMind的LangfunAgent、微软(+OpenAI)的Aworld、麻省理工学院(MlT)的lnfantAgent、Meta的/OWL-Workforce,排名榜首!掀起了AI的下一个浪潮(“世界模型”)。
四、研制第六代半导体显示技术超高像素前沿技术和生产线
京东方成功研制第六代新型半导体显示器件前沿技术(超高像素密度:2.24英寸,1700个像素),打破现行国际上的王牌地位,并对车载中控屏窄边框设计配上AI智能调光。同时京东方建成了全球最先进的第六代新型半导体显示器件生产线,并可量产。
本次例会接着讨论《20届开源中国开源世界大会》的筹备工作。
参会人员:陆首群、刘澎、安泱、陈道清、袁怿、谭中意、宁固、程海旭、王铁震、孟迎霞、张侃、靳虹博、陈越、宋可为、鞠东颖、陈钟(线上)、陈绪(线上)、陈伟(线上)、刘明(线上)、胡宇(线上)、韩宪平(线上)、Anna.AI(线上)、王劲男(线上)。