开源通讯

COPU会议纪要丨2025.08.12

2025-08-13 09:00:34 67

图片关键词

812日陆主席主持召开COPU例会

一、在722COPU例会上,由陈钟、谭中意及刘澎、章文嵩牵头的两个小组针对全球权威评测机构发布的生成式语言大模型排行榜,分析中外顶尖大模型的竞争态势(目的是要回答中国品的大模型是否进入了世界排行榜的先进行列?)

729COPU例会上,COPU要求这两个小组还要对此进行深化分析,提出高质量完善化的报告。

从陈谭小组提出的报告来看,举出几家主流排行榜,加上发布的不同时序,别对各种先进大模型进行评估,似乎难以进行同等条件对比。以依据权威的LMSYS Chatbot Arena排行榜为例,当时尚未作最新的公布(直到202581日谭中意才将其最新公布的排行榜报COPU秘书处),而陈谭小组报告依据的是711日马斯克在Grok-4发布会上提前发布排行的偏面信息,以及716日向元宝询问作答冒充LMSYS Chatbot Arena排行榜的不实信息。 

现将202581LMSYS Chatbot Arena最新发布的排行榜信息列

1Gemini-2.5pro 

103-2025-o4-16 

2Chat GPT-4o-latest-2025 0326 

2GDT-4.5 preview-2025-02-27 

3Qwen3-235b-a22b-Instruct-2507 

4Grok-4-0709 

5KIMI-K2-0711 Preview 

5claude-opus-4-2025-0514 thinking-16k

6DeepSeek-R1-0528 

7Claude-Opus-4-2025-0514 

722COPU例会上,陈小组提出衡量大模型先进性的基本条件取决于算法、算力和数据,对中方而言,陈钟教授更出:其中算法要好算力要跟上,数据要求规模大质量

729COPU例会上更关心中方在算法、算力和数据上的改进创新其实这项任务国内很早就提出来了,陈小组不能笼统之,落实要进行深刻分析,提出或归纳有说服力的解决方向。这里以提高算力为例,国内很多单位都在进行算力攻关,现提出几例你们参考如华为已公开发布cloud matrix系统、改革网络总线连接架构以提高芯片算力集成效率的方案;华为昇腾创新开源CANN方案,将挑战英伟达CUDA,提高芯片算力(你们可先访问丁蔚);还有智源与龙蜥合作,成立智算基础设施联盟,牵手FlagOS,完善从模型+系统+芯片,打造技术和生态,提高算力,挑战CUDA。这表示在谈到中方如何进行算力创新时,要深刻分析中方的创新方向!

二、本次例会对上次例会刘澎、章文嵩小组提出的“国内AI虎发展动向”的报告进行商榷。 

(一)COPU提出关于月之暗面(Moon Shot AI)先后发布KIMI-K1.5大模型和KIMI-2-Ontex2大模型问题。

2025120月之暗面发布KIM1-K1.5大模型,与DeepSeek-R1同期迟后2小时发布,性能相近(DeepSeek-R1Open o1o4同等)。当时KIMI-K1.5大模型是闭源的,后来宣布开源。

LM arena 2025721日发布的开源大模型排行榜:

(1)Kimi-K2-Ontex2(月之暗面/Moon Shot) 

(2)Qwen3(阿里巴巴) 

(3)DeepSeek-R1(深度求索)

(4)Gemma 2.9BGoogle) 

(5)Llama370BMeta) 

LMSYS Chatbot Arena 202581日发布开、闭源混合大模型排行

(1)Gemini-2.5pro 

1Gemini-o3

(2)ChatGPT-4.0 

2GPT-4.5 preview 

(3)Qwen3-235b 

(4)Grok-4

(5)KIMI-K2 Preview

5Claude-opus-4

(6)DeepSeek-RI 

国内有一种舆论,月之暗面受DeepSeek冲击较为明显,事实是这样的?特别是近期,看一下上面两个大模型排行榜:KIMI-2 Ontex2的性能优于DeepSeekR1

关于零一万物的业务方向问题

这要从2025320日李开复博士接受美国彭博社专访说起。李博士指出,DeepSeek很优秀,取得了创新突破,但DeepSeek基座模型与其他标准的普惠的基座模型一样,需要解决基座模型与市场需求之间存在应用缺位问题,有待于大大提高其商业价值问题。由于未充分掌握企业/行业的数据,缺少连接企业的知识库,尚待搭建应用中间件,DeepSeek优质基座模型还难以直接转变为企业的生产力。因此必须把企业/行业的数据抓起来,进行应用补缺,以真正发挥DeepSeek大模型的价值。

面对彭博社记者提问,李开复说:零一万物将转变业务方向,即放弃建设生成式语言大模型,转入为DeepSeek应用服务,我们本周发布的产品——万智企业大模型一站式平台是专门为DeepSeek大模型补缺应用服务的,我们看好DeepSeek惊艳业界的技术创新,其开源模式更是压倒性优势,我们愿为其补缺企业/行业的应用服务,我们提出的万智企业大模型一站式平台提供安全模型部署方案、模型微调方案,还封装了网络搜索知识库RAGAgent搭建工具,助力DeepSeek以优质基础模型赋能企业应用场景

三、本次例会发表陈瑜可为小组提出AIOS分析报告,会上由小组代表袁怿对“AI-LLM新一代操作系统初步分析”做了介绍,同与会人员进行了讨论。

当前计算领域正经历一场深刻的范式转变,传统操作系统(OS)正在向以人工智能(AI)为核心的新一代智能操作系统演进。这份报告深入分析了全球领先的 IT 企业(如谷歌、微软、Meta、红帽、特斯拉、华为、VIVOOPPO、小米、阿里巴巴、腾讯、字节跳动等)如何构建面向 AI 或大型语言模型(LLM)的操作系统,并审视了学术界在这一前沿领域的研究现状。

当前的发展现状表明,AI 操作系统不仅仅是运行 AI 应用程序的平台,其核心功能和架构本身就由 AI 驱动,实现了自适应智能、自然语言交互、自优化资源管理和 AI 代理间的共享内存。这种转变源于大型模型对计算资源、实时响应和边缘处理的巨大需求,促使操作系统从静态规则走向动态学习和预测。

各大科技公司正采取多元化策略:谷歌通过FuchsiaAndroid 和 ChromeOS 的 AI 深度融合以及定制 TPU 构建“AI 无处不在”的生态系统;微软则通过 Windows AI 和 Azure AI 平台,结合 Maia 等定制芯片,推行“设备端+云端”的混合 AI 策略;Meta 以其对 AI基础设施的巨额投资和 PyTorch 的开源领导地位,旨在实现 AGI 的计算主导;红帽则专注于通过其开源混合云平台,为企业提供 AI 运营(MLOps/LLMOps)的基础设施支持;特斯拉则展现了高度垂直整合、面向特定应用(自动驾驶)的 AI 操作系统范例;而华为、VIVOOPPO、小米等移动设备制造商则致力于将 AI 特性深度融入日常用户体验,推动 AI在设备端的普及。国内的阿里巴巴、腾讯和字节跳动则在云原生 AI操作系统、LLM 优化、AI 驱动的内核优化以及新型代理间通信协议(如 A2A 等)方面取得显著进展。

学术研究正从根本上重构操作系统,提出AIOS 等新架构,并专注于 LLM 性能的微观优化和 AI 特有安全漏洞的防御。这些努力共同推动了计算范式的演进,预示着一个由智能、自适应、情境感知系统主导的新时代,将重塑人机交互和技术创新。

四、本次例会陈钟、谭中意小组递交全球和中国AI大模型产业发展分析报告及202581日公布的Text Arena排行榜(开源、闭源混合大模型),由于会议议程太多,下次例会在讨论。

五、丁蔚在线上汇报华为鲲鹏昇腾创新的开源CANN方案,挑战英伟达CUDA提高算力的方案。本来请丁蔚到COPU例会上来汇报,丁在深圳有会建议上午10:30后通过在线与我们交流,(陆主席考虑这样交流效果不好,作出暂停的决定)在今天的例会上先由陆主席简单介绍CANN

陆主席说:英伟达CUDA生态,华为鲲鹏昇腾CANN如何破?

华为采用CANN挑战英伟达CUDA,要走出一条发展算力的新路,CANN瞄准研发算力底座,这代表AI主权的,必须自主建设

英伟达算力的护城河不是AI算力芯片,也不是GPU性能,而是CUDACUDA的护城河是生态。

华为CANN发展生态和算力,不走CUDA的老路,不是重复CUDA,而是挑战CUDA

华为CANN实行开源,不同于CUDA坚持的闭源。华为发展开源生态,并依托中国环境特别优势的土壤,实行行业协同,与行业及高校、研究部门联合起来,鼓励个体开发者参加,未来要组织百万大军。华为与行业协同,与全国金融、医疗、制造等行业协同,使生态快速成长。华为CANN一手抓算力资源、算力技术,一手抓生态。抓技术注重基础研究和系统工程能力,最近在全国15所顶尖大学,协助他们建设算力小集群(孵化中心)和算力环境,他们已经开发了190多个RunTime接口,清华大学的算力孵化器开发KTransformer,走千亿模型一卡机的起步。我们的合作不是单纯为了华为提升产业,同时是培养AI人才,发展国内算力产业,实行共创、共享、共存。生态、技术两手要融合、协同。架构、协议、代码等关键技术要制定、执行标准。

六、会上朱其罡老师向大家介绍了FlagOS。

图片关键词


参会人员:陆首群、章文嵩、陈伟、安泱、靳虹博、袁怿、谭中意、隆云滔、朱其罡、王珊、张侃、程海旭、鞠东颖、刘澎(线上)、陈钟(线上)、陈道清(线上)、刘明(线上)、胡宇(线上)、韩宪平(线上)、Anna.AI(线上)。

图片关键词


首页
秘书处
开源通讯
开源活动