COPU简讯|陆首群主席在FlagOS开放计算开发者大会上发言
2025年9月26日,FlagOS开放计算开发者大会在北京拉开帷幕,会上陆主席以视频的方式祝贺北京智源人工智能研究院携手全球生态伙伴,发布了“大模型全栈开源技术基座FlagOS 1.5”,他指出FlagGems算子库已让国产芯片在相同任务上比CUDA算子平均提速30%,显著缩小与英伟达H100的绝对算力差距。他期待社区持续突破,以高性能、低成本和开放生态打破CUDA垄断,共建AI计算新平台。

陆主席发言内容如下:
各位专家、各位朋友,大家好!
热烈祝贺首届FlagOS开放开源计算开发者大会胜利召开!
由智源研究院牵头,联合高校、科研院所、企业,结成Flag〇S开源社区,并在PyTorch基金会生态项目体系支持下,共同打造跨芯片、跨架构的FlagOS开源统一系统软件堆栈,提升芯片算力,以期打破英伟达CUDA算子生态垄断,共同构建AI计算平台。
我曾在大会举办前参加了你们有关FlagGems的预热讨论。FlagGems是一个单芯片级高性能的开源通用AI算子库。你们成立的时间不长,FlagGems算子库比CUDA平均提速30%,而且一些性能也超越了CUDA,这是了不起的成就,值得向你们致敬、祝贺!
但我还认为,你们的核心价值在于提升芯片的计算效率,通过你们的算子库比PyTorchATen的CUDA平均提速30%,意味着支持FlagGems的国产芯片在执行相同的计算任务(尤其是大规模训练和推理)时可以更充分地挖掘芯片本身的潜力,逐步成熟起来,缩短与CUDA产生的绝对算力的差距。
FlagGems是一个高性能通用AI算子库,CUDA是英伟达的平行计算平台和编程模型,它们并非直接对比的对象,更合理的比较是:塔载FlagGems的国产芯片与搭载CUDA生态的英伟达H100芯片(目前的旗舰产品)在性能、成本、生态和发展前景上可作对比。
最后谨祝朋友们取得更大的成功!