COPU会议纪要丨2025.08.26
8月26日,陆主席主持召开COPU例会。
本次例会发布了陆主席新作《探索在当前AI大模型发展中开源与闭源共存协同的“二元模型”》。
探索在当前AI大模型发展中
开源与闭源共存协同的“二元模型”
陆首群
2025.8.20
在当前AI大模型发展中充斥着开源与闭源之争。
我们认为,执行开源策略,有利于开源迭代创新,发展生态和维稳,有利于协同实行数字化转型和智能化重构,吸引开源社区和个体自由开发者协同创新,创造高质量的开源模型。
如果在大模型研发中商业模式没有选择好,企业将会承受来自商业的压力或企业需要加强商业控制,这是一些企业执行闭源策略的思考。
甲,美西方AI头部企业配置“二元模型”促发展
几则短讯
1)Open AI的CEO奥特曼违背要采取开源策略的初心,从研发GPT-4(2024.3.14发布)开始采取闭源策略。在2024年底以来DeepSeek冲击下,他在2025年1月31日对《华尔街日报》说,Open AI在对待开源AI软件方面一直站在历史错误的一边。他于2025年2月1日将o3-mini系列产品(Low、medium、high)进行开源(开发免费推理模型),使Open AI成为同时运行闭源+开源的二元模型,但由于o3-mini系列属轻量级的,此时“二元模型”的影响并不大。
2)2025.6.2我们在检查Grok-1,-2,-3大模型所属开、闭源时,发现Grok-1,-2是开源的,Grok-3都是闭源的(后来还发现Grok-4是闭源的)。在我们印象中,XAI的CEO马斯克(Elon Musk)一直主张采取开源的,他作为OpenAI的创始人之一,曾对奥特曼(Sam Altman)违反初心采用闭源策略还与之引发诉讼,因此他在研制Grok大模型后期采用闭源似乎是被逼的。
3)最近我看到中科院关于大模型开源闭源策略选择的研究报告中谈到:Meta拟将开源模型Behemoth转闭源,十分惊讶!因为Meta是研发开源大模型Llama的大户,其CEO扎克伯格一直强调“开源AI是前进的道路”,他们要“利用开源技术构建世界领先、稳健的基础模型”,“Llama是AI世界的Linux”。经我们查证,他们将计划开源的Behemoth(或Llama 4)转闭源,确有其设想,其原因可能是用来作为商业模式服务。
美国AI大模型头部企业
配置二元(开闭源)模型情况
现在从美国的一些AI大模型头部企业来看,他们正在探索(可能大多是被动)配置开源和闭源的“二元模型”找出路:
谷歌:Gemini(闭源)+Gemma(开源)+DeepMind(开源)
OpenAI:GPT-5系列(闭源)+GPTOSS(开源,与微软共同开发)
微软:Copilot(闭源)+GPTOSS(开源,与OpenAI共同开发)
XAI:GroK-1,-2(开源)+GroK-3,-4(闭源)
Meta:Llama-1,-2,-3(开源),+Behemoth(或Llama-4,闭源)
开闭源“二元模型”如何发挥各自和协同功能
我们认为,开闭源并存的“二元模型”应该是支持AI大模型发展的战略选择,开源和闭源在AI大模型中既可发挥各自的功能,又可发挥协同的功能。开源的功能是建设创新中心、生态中心、维稳中心,为了实现AI大模型高质量的战略目标,闭源的功能是建立一个完善的商业服务模式,建设商业中心和技术代差服务中心,支持AI大模型产业的发展。二元协同,最终为了满足市场需求,共同服务于AI大模型企业发展的整体战略目标,相互起到协同互补、双轨并行的关系。
中外对本文的初步反应”
我对“二元模型”的思考即刻征询国内外意见。
在征询DeepSeek时,它的回答:
您观察到的现象非常敏锐和准确!它确实是当前AI大模型领域一个非常重要且清晰的发展趋势和战略规律。
头部企业同时布局开源和闭源“二元模型”,并非偶然,而是它们在技术、商业和生态竞争下的必然战略选择。这已经成为一种新的行业范式(Paradigm)。
下面为您深入剖析这背后的规律和逻辑。
为什么“二元模型”策略会成为规律?
核心原因在于,开源和闭源模型各自解决了不同的问题,满足了不同的市场需求,最终共同服务于公司的整体战略目标。它们不是相互替代的关系,而是协同互补、双轨并行的关系。
我们可以从以下几个角度来理解这个“规律”:
(1)商业变现vs. 生态构建(Commercialization vs. Ecosystem)
· 闭源模型(如GPT-5, Gemini Advanced)是“利润中心”:
· 目的:通过提供最顶尖、最稳定的AI服务,直接向B端(企业)和C端(个人用户)收费(API调用费、订阅费)。
· 优势:保护核心知识产权和技术机密,建立持续的“技术代差”和收入流,以支撑天价的研发和算力成本。
· 开源模型(如Llama, Gemma, GPT-OSS)是“生态中心”:
· 目的:免费开放能力强大的模型,旨在构建开发者生态、获取信任、建立行业标准。
· 优势:
· 抢占开发者心智:让全球开发者习惯基于你的模型进行创新和开发,形成强大的社区和护城河。
· 数据安全市场的敲门砖:金融、医疗、政府等对数据隐私要求极高的行业无法使用闭源API,开源模型允许他们本地化部署,从而攻克了这一巨大市场。
· 反制竞争对手:用一款高性能开源模型直接冲击其他开源对手的市场,瓦解它们的独特性。
(2)技术探索vs.市场应用(Exploration vs. Application)
· 闭源模型是“研发部门”:负责探索最前沿、未知的技术领域(如AGI、复杂多模态、超级对齐),这些研究成本极高,风险极大,必须通过闭源来保护并将其商业化。
· 开源模型是“市场部”:将已经趋于成熟的技术(通常是上一代或精简版架构)开源释放,迅速渗透到各个垂直行业和应用场景中,激发长尾创新,收集真实世界的使用反馈。
(3)竞争格局下的“双重打击”策略
在激烈的市场竞争中,“二元模型”策略提供了双重优势:
· 用闭源模型打“高端局”:在性能、体验上直接与OpenAI的GPT、Google的Gemini等顶级闭源模型竞争,争夺高端付费用户。
· 用开源模型打“地面战”:在广阔的开发者市场、中小企业市场和特定行业市场,与Meta的Llama、Mistral等开源模型竞争,甚至通过提供比对手更优的开源模型来“釜底抽薪”。
不同公司的战略侧重
虽然都是“二元”,但不同公司的侧重点因其基因和优势而异:
公司闭源代表开源代表战略侧重分析
OpenAI GPT-4/5 GPT-OSS (新发布) 从“纯闭源”转向“二元”。 以前全靠闭源API赚钱,现在面临开源社区巨大压力,不得不发布GPT-OSS来回归生态,应对竞争。
Meta (可能未来的Behemoth) Llama 系列 “开源为主,试探闭源”。 凭借Llama已成为开源生态的绝对领导者,现在考虑用闭源模型来实现更好的商业回报。
Google Gemini Advanced Gemma 典型的“二元均衡”策略。 既用Gemini捍卫其搜索和云服务的核心商业版图,也用Gemma参与开源生态竞争,吸引开发者到Google Cloud。
微软Copilot (服务) Phi系列、WizardLM “云服务至上”。 微软本质是云厂商(Azure),它的核心目标是让更多AI模型跑在自己的云上。无论是集成OpenAI的闭源模型,还是推出自己的开源模型,都是为了卖云服务。
xAI Grok-3/4 (闭源) Grok-1-2 (开源) “开源引流,闭源变现”。 先将早期技术开源(Grok-1,-2)制造声量和吸引关注,然后将最先进的技术作为闭源服务集成到X(推特)平台中,为核心社交产品赋能。
结论:算不算一个发展规律?绝对算。
同时开发开源和闭源模型,已经成为头部AI公司在这个阶段参与全面竞争的标准配置和战略规律。这标志着AI行业的竞争已经从单纯的技术竞赛,升级为 “技术、生态、商业、战略”四位一体的全方位综合竞赛。
· 只做闭源:可能面临生态薄弱、无法渗透特定市场(如数据安全敏感型行业)、被社区指责为“封闭”的风险。
· 只做开源:可能面临巨大的研发成本无法通过直接商业变现回收的可持续性问题。
因此,“二元模型”战略正是在尝试规避单一路径的缺点,同时攫取两种模式的优势,是巨头们在当前市场环境下找到的最优解。在未来可预见的时间内,这都将是主导性的发展规律。
在征询元宝时,它的回答:
当前大模型头部企业普遍采用“开源+闭源”双轨并行策略,这一现象并非偶然,而是技术演进、商业竞争和生态构建多重因素驱动的结果。以下从技术、商业和行业三个维度分析其内在逻辑,并探讨是否构成发展规律:
(1)技术维度:分层覆盖需求,优化资源分配
闭源主导高性能场景:闭源模型(如Gemini、GPT-5)通常聚焦复杂任务(多模态推理、长上下文处理),依赖专用算力与数据壁垒保持技术领先。例如,Gemini 2.0支持200万token上下文,专为企业级高精度需求设计。
开源适配长尾需求:轻量级开源模型(如Gemma、GPT-OSS)降低技术门槛,推动生态繁荣。Gemma 3仅需单块H100 GPU即可运行,覆盖教育、本地开发等场景。
协同技术迭代:开源模型可视为闭源技术的“试验场”。例如,GPT-OSS采用与GPT-5相似的MoE架构,但参数规模更小,既验证技术可行性,又吸引开发者贡献优化。
结论:技术分层是效率最优解,闭源保障尖端突破,开源加速技术渗透。
(2)商业维度:构建生态闭环,实现利润最大化
闭源直接变现:通过API调用(如GPT-5收费$1.25/百万token)或企业定制服务(如Gemini医疗方案)获取高利润。
开源间接获利:开源模型培育用户习惯,推动关联业务(如谷歌云服务、微软Azure算力租赁)。谷歌云业务2024年增速超30%,部分归功于Gemma生态带动。
防御性竞争:Meta开源Llama系列对抗谷歌/OpenAI,而DeepSeek以低成本开源模型(如R1)倒逼巨头开放部分技术。
结论:“高端闭源+长尾开源”形成商业闭环,兼顾利润与市场份额。
(3)行业维度:应对监管与地缘博弈
合规与安全:闭源模型更易满足数据隐私(如医疗、金融)和内容审核要求(如Gemini内置安全模块)。
地缘技术竞争:中国通过DeepSeek等开源模型降低对西方技术依赖,而谷歌开源Gemma旨在争夺全球开发者话语权,避免生态被孤立。
结论:双轨制是企业平衡监管压力与技术影响力的策略工具。
是否构成发展规律?
短期必然性:在算力成本高企、技术快速迭代的背景下,二元策略是头部企业的理性选择。开源与闭源的分工协作已形成“技术降维打击+生态反哺”的正循环。
长期不确定性:若开源社区(如DeepSeek、Llama)持续突破性能瓶颈,或算力成本大幅下降,闭源模型的壁垒可能被削弱。但目前来看,双轨制仍是主流路径。
最终判断:二元模型开发是当前阶段的阶段性规律,但技术民主化趋势可能在未来重塑这一格局。企业需动态平衡开源与闭源的边界,避免陷入“技术霸权”或“生态孤立”的极端。
本文作者对Deepseek及元宝回答或点评的再点评:
Deepseek回答在“(1)商业变现vs生态构建”中谈到的“二元模型”的解决方式,基本上与本文作者的提议是一致的。
Deepseek回答在“(2)技术探索vs市场应用”中谈到的“二元模型”的解决方式,本文作者认为这是值得商榷的。它针对的研究领域是AI发展的未知领域(如AGI)或其前沿技术。
以通用人工智能AGI为例来说,这对AI的发展正处于人类智能是否超越AI智能的关键时刻,人类面临控制AI为人类服务或AI可能消灭人类的关键时刻,此时要求全球采取控制AI的统一的技术措施和严格的监管,并且既然AI可能威胁到人类的生存,人类也有知情权的要求,采取开源提高透明度措施成为必然!
Deepseek回答在“(3)竞争格局下的双重打击 策略”中,涉及二元配置的案例,正如我在文中展示的有开闭源配置先后及并列的不同案例,在具体问题具体分析下,第(3)条的处理方式与第(1)条是雷同的。
元宝从技术、商业和行业三个维度分析,元宝的回答和Deepseek基本一致。我基本上赞成元宝对我文章的短评。元宝谈到当前AI大模型头部企业拟采用“二元模型”双轨并行策略并非偶然,这是技术演进,商业竞争和生态构建多重因素驱动的结果。
乙:中方AI大模型企业依靠开源技术(+商业模式)促发展
国内一些AI大模型发展现状
国内一些AI大模型由原来闭源转为开源
l月之暗面:Kimi-K1.5(2025.1.20发布时采用闭源,后来转为开源)
最近发表的Kimi-K2(一开始便实行开源)
l百度文心一言:由闭源转为开源
l字节跳动:由闭源转为开源
国内一些AI大模型一开始就实行开源的
l阿里云,通义千问,Qwen系列
l深度探索DeepSeek系列
l小米Mimo
l零一万物Yi系列
l智谱AI GLM等
中方AI开源大模型企业依靠开源技术促发展(不需要“二元配置”来促发展)
由开源技术主导=开源技术+匹配的商业服务模式,此处采用的由开源技术匹配的商业服务模式
既不同于“二元配置”中由闭源主导的商业模式,也不宜采用已经失效浅度的商业模式。
举例①,Meta开发的开源Llama模型,使Meta成为开源大模型的龙头企业,近日美媒问询Meta,采用何种商业模式,Meta答采用广告式的商业模式。当时我就担心如此浅度的商业模式将大大降低Meta的商业收益,果然Meta将被逼采用“二元配置”。
举例②,RedHat早年采用订购服务作为其商业模式,如此浅度的商业模式早已失效。
会上,宋可为代陈渝教授介绍全国大学生操作系统设计比赛的情况,本次参赛大学生1360人。
参会人员:陆首群、章文嵩、宋可为、安泱、荆琦、程海旭、朱其罡、靳虹博、袁怿、隆云滔、郭洪韬、王珊、张侃、陈道新、孟迎霞、鞠东颖、陈连虎、刘澎(线上)、陈钟(线上)、陈绪(线上)、陈伟(线上)、陈道清(线上)、胡宇(线上)、韩宪平(线上)、Anna.AI(线上)。