COPU会议纪要丨2025.09.02
9月2日,陆主席主持召开COPU例会。
本次会议首先传达一则来自中兴通讯的消息:
中兴(ZTE)研发的超级智能体CO-Sight在今年4月底通过权威基准测试(GAIA),力压谷歌(DeepMind)智能体Langfun Agent、微软(+OpenAI)、智能体AWorld、MIT智能体OWL-Workforce、Meta智能体Infant Agent,登顶榜首。
随后,中兴向COPU进行了汇报,COPU指出,当前智能体(Agent)发展很快,不能凭一次测试结果定优劣,希望中兴不断改进Agent,不断进行测试,也不断向COPU通报。中兴遵照执行,最近一次通报是8月29日,中兴谈到:从4月到8月,中兴集中精力改进智能体,现在推出CO-Sight 2.0,在8月28日再次测试获得榜单第一(预计9月会正式发布)。
会上中兴通讯标准部部长田力通报大规模智算集群开放开源互联创新情况(标准、生态、主权、产业链、孵化器)。
本次会议公布了新智元的报导:a16z最新发布《全球Top100消费级GenAI应用榜单》。该榜单显示:AI竞争格局逐渐稳定,中国力量全面崛起,ChatGPT依旧领跑,谷歌Gemini紧随其后,Grok高速逆袭。5家中国公司跻身全球前20,分别是DeepSeek全球排名第3、夸克Quark全球排名第9、豆包Doubao排名全球第12、月之暗面Kimi排名全球第17、通义千问Qwen3全球排名第20。(此外,可灵KlingAI上榜全球排名第33)。
在移动应用榜单中,豆包拿下全球第4、百度AI搜索全球第7、DeepSeek全球第8、美图全球第9,以及夸克上榜第47。
COPU编者:本次会议发表新智元转发a16z最新发布的报导,有必要发布陈钟教授随后发表点评意见:新智元转发的排行榜不代表大模型的水平,只是提供服务的网页版和移动版流量的排名,不能说明水平的高低,跟陆主席提出的中国顶尖大模型在世界排行榜是是否占据前列是两码事。编者认为陈钟教授区分两种排行榜的意见是对的。
陈钟、谭中意小组在上次例会上针对中国顶尖大模型是否处于世界排行榜前列中地位的报告,我们准备在COPU《人工智能文集》第二十八集上发表。至于a16z的属于流量统计的排名榜,我们也予以发表。但他们谈到的国内处于前20的流量服务大模型:如夸克Quark、豆包Doubao、美图、海螺、可灵KlingAI等,请处理“六小虎”发展状态的刘澎、章文嵩小组核查一下其实际水平如何?
【新智元导读】a16z最新发布「全球Top100消费级GenAI应用榜单」
网页排行前50
移动应用排行前50
不论是你常用的DeepSeek、豆包、夸克,还是一直领先的ChatGPT和Gemini,或者是新进榜单Lovable等,这场AI产品的「百团大战」依然在继续!
首先来看网页排行榜,本次榜单中,5家中国公司跻身全球前20。
分别是DeepSeek全球排名第三、夸克Quark全球排名第九、豆包Doubao排名全球第十二、月之暗面Kimi排名全球第十七、通义千问Qwen3全球排名第二十。
此外,可灵KlingAI上榜全球排名第三十三,海螺AI排名45。
在移动应用榜单中,排名有较大变化。
豆包拿下全球第四、百度AI搜索全球第七、DeepSeek全球第八、美图全球第九,以及夸克上榜第四十七。
以上都是我们熟悉的产品,设有中文网站,a16z统计这些产品超过75%的流量来自国内。
其中,值得一提的是,国内的视频模型比海外的产品更具优势——因为中国有更多研究人员专注于视频领域。
照片和视频类别的集中度尤其高,仅美图一家就贡献了五个席位:Photo&VideoEditor、BeautyPlus、BeautyCam、Wink和Airbrush。
字节跳动也是一个重要参与者,旗下产品包括豆包和Cici(通用大语言模型助手)、Gauth(教育科技)和Hypic(照片/视频编辑)。
这是首次对谷歌几款应用单独的流量进行排名并收录。
该公司的通用大语言模型助手Gemini位居第二,仅次于ChatGPT,其网站访问量约为ChatGPT的12%。
谷歌还有哪些产品上榜?
面向开发者的AI Studio首次亮相即跻身前十。
该网站提供了一个沙盒环境,开发者可在此基础上使用Gemini模型进行构建,包括多模态模型。
紧随其后的是排名第13的NotebookLM。
该产品在作为Google Labs的一部分推出后,现已作为独立网站运营。
NotebookLM在近一年前首次爆红,此后稳步增长,仅在夏季有轻微下滑(可能源于学术用户的暂时性流失)。
作为谷歌面向消费者的AI实验平台,Google Labs排名第39。
Labs平台承载了Flow(用户可在此试用视频模型Veo3)以及其他多款应用。
在2025年5月Veo3发布后,Google Labs的流量飙升超过13%,创下过去一年的最大单月增幅。
在移动端,Gemini同样排名第二,紧随ChatGPT,但差距要小得多,其月度活跃用户(MAU)已接近ChatGPT的一半。
Gemini在安卓设备上表现尤为强劲,其近90%的MAU来自安卓平台,相比之下,ChatGPT的安卓用户占比为60%。
在通用大语言模型助手的激烈竞争中,ChatGPT仍保持领先,但谷歌、Grok和Meta正在缩小差距。
Grok在网站榜上排名第4,移动榜上排名第23。
该公司在移动端的跃升尤为惊人,从2024年底无应用的「冷启动」状态,发展到如今超过2000万的月活用户。
2025年7月,Grok的移动端用量迎来巨大增长,随着7月9日新模型Grok4(具备更强的推理能力、实时搜索和工具集成)的发布,用量攀升了近40%。
紧接着,7月14日又推出了AI伴侣头像功能。
发布初期,动漫头像Ani(包含NSFW选项)尤为火爆。
相比之下,Meta的努力至今增长较为平缓。其通用助手MetaAI在网站榜上排名第46,未能进入移动榜单。
MetaAI于2025年5月底推出,但增长速度远不及Grok,尤其是在2025年6月发生了一次「公开动态」事件(用户发现自己的部分帖子被公开发布)之后。
在通用大语言模型助手的其他战线,Claude在移动端均已明显增长放缓。
Perplexity则与Grok一道,持续展现强劲的增长势头。
在网站端,Perplexity和Claude持续增长。
在网站榜单中,有11个新晋应用的上榜是由流量增长驱动的。
相比之下,在a16z 2025年3月的榜单中,新晋者达17个。
移动应用榜单的新面孔则明显更多(14个),这得益于各大应用商店对「山寨ChatGPT」应用的打击(也就是所谓套壳),为更多原创移动应用腾出了发展空间。
接下来陆主席谈到,最近在《COPU开源生态交流平台》上,韩宪平、朱其罡、王子亮、袁怿等人在热烈讨论MCP、A2A、AG-UI、ANP等公共协议,这使我想起了3个月前宋可为从浙江大学韩蒙教授那里带回一篇长文:“大模型上下文协议(MCP)引领AI系统范式转型”,希望在我们创办的《人工智能文集》上刊登这篇文章,我们为此在第二十七集《人工智能之集上》刊登了这篇文章,不知COPU业内人士看了没有?不过我看到卷入韩老师他们这次讨论的COPU人士很多。我请秘书处将这篇文章制成活页,带到这次例会上,参加大家的讨论。
我先介绍这篇文章各章节的标题作为这次讨论的开场白:
《从语言智能到行动智能:模型上下文协议(MCP)引领AI系统范式转型》
浙江大学 韩蒙
1、智能体通信协议蓬勃发展:构建智能代理的通用交互基座
1.1 架构设计:统一模型与外部系统的通信模式
1.2 通信机制与运行流程:支持跨平台的高效交互
1.3 功能价值与生态意义:从语言模型走向智能代理
1.4 展望:作为智能代理生态的基础设施
2、智能体协作协议体系:MCP、A2A与ANP的融合机制
2.1 协议体系的结构分工与技术定位
2.2 协议间的协同机制与关系演化
3、全球智能代理协议格局演进:MCP、A2A、ANP的国内外现状分析
3.1 国际态势:协议标准化推动智能代理生态初成
3.2 中国路径:以应用牵引三大协议加速落地
3.3 全球格局:技术主导、场景驱动与规则塑造的多方博弈
4、协议风险与智能体生态的可信困境
4.1 MCP协议:模型能力开放的风险入口
4.2 A2A协议:智能体协作中的信任断裂
4.3 ANP协议:去中心化网络中的结构性风险
5、智能体通信协议的可信生态构建路径
5.1 可信Agent通信协议生态治理体系建设路径
5.2 产学研协同推进可信Agent通信协议生态建设
6、迈向可信智能秩序:智能体通信协议的协同演化
对该文进度展开
3.1)国际态势:协议标准化推动智能代理生态初成
国际人工智能大模型生态在通信协议层面呈现三大技术演进方向:
①由Anthropic主导的MCP聚焦模型与外部环境的连接
②Google推出的A2A致力于智能体之间的协作通信
③OpenAI提出的ANP则构建多智能体网络间的通信框架。
协议迭代:MCP强化安全与流式传输,A2A聚焦语义协同与任务协商,ANP则突出身份识别与消息路由能力
4.1)MCP协议:模型能力开放的风险入口
①是上下文信息不对称风险。
②是认知层攻击风险加剧。
③是协议生态信任碎片化。
④是数据访问权限边界模糊。
4.2)A2A协议:智能体协作中的信任断裂
①身份伪造与指令污染风险
②通信通道安全机制薄弱
③审计追踪与责任界定缺失
4.3 ANP协议:去中心化网络中的结构性风险
①是去中心化身份管理风险
②是节点行为监管难题
③是网络拓扑与信誉体系薄弱
④是管理机制不足导致信息滞留
5.1 可信Agent通信协议生态治理体系建设路径
①是优化标准化身份与能力描述
②是强化细粒度动态权限控制。
③是健全行为审计与可追溯体系
④是构建跨协议“桥”可信机制
5.2 产学研协同推进可信Agent通信协议生态建设
①是引导标准制定与治理框架建设。
②是强化基础理论攻关与开源支持
③是推进工程化落地与场景验证
④是推动产学研用多方协同合作
会上ANP开源技术社区发起人常高伟介绍了ANP的发展历程,核心技术与理念,以及与MCP,A2A的区别。最后分享了ANP开源社区的运行以及最近加入开源基金会的工作。
会上陈渝教授简要介绍了麒麟软件、统信、华为、阿里、小米、VIVO、OPPO等在分析研究AIOS上的一些思路,并进一步分析了微软端云结合的AIOS布局,苹果侧重端侧软硬协同并与先进大模型企业合作的发展思路,以及谷歌持续突破大模型核心技术加上以android为代表的端侧模型并举的全面深化AI战略。这些举措说明了AI训练推理新技术和多模态交互模式将深刻影响AIOS后续发展。
参会人员:陆首群、章文嵩、陈渝、苗宗利、安泱、朱其罡、张盛毅、徐梦江、袁怿、常高伟、田力、谭中意、张侃、靳虹博、鞠东颖、刘澎(线上)、陈钟(线上)、陈绪(线上)、陈伟(线上)、陈道清(线上)、程海旭(线上)、刘明(线上)、韩宪平(线上)、王子亮(线上)、胡宇(线上)、Anna.AI(线上)。