OpenAI上一次开源大语言模型,已经是2019年的事情了:11月6日,OpenAI正式发布了GPT-2最后一个部分的完整代码,其中包括含有15亿参数的最大版本。然而,自OpenAI于2022年年底推出ChatGPT以来,从GPT-3再到最新的OpenAI o3-mini都再也没有开源过。但OpenAI成立时表示是为了推动AI的安全性和有益发展,确保AI的发展能够被广泛共享,并且对全人类都是有益的。因此很多人调侃让OpenAI改名为“CloseAI”。
DeepSeek横空出世后,Sam Altman在被问及OpenAI是否会公开部分AI模型技术并展示更多系统工作原理的研究时,他表示公司内部正在讨论这种可能性,承认OpenAI此前在开源策略上可能“站在了历史的错误一边”,称正在讨论公开AI模型权重。不过他也指出,公司内部并非所有人都认同这一观点,而且这也不是当前的首要任务,最重要的是继续按研究规划推进工作。
DeepSeek为何能成为爆款?
DeepSeek日前发布的大模型DeepSeek-R1,各项性能与OpenAI的GPT-4o持平?,仅用时两个月就完成了训练,同时过程中仅用了2000个英伟达H800 GPU,其他主流AI实验室通常需要部署的芯片数量估计超过10000个 —— 展现出算法创新和架构优化可能比算力更重要,对建立在海量计算资源独占之上的整体商业模式形成了威胁。值得注意的是,其大幅降低了AI计算成本,约为550万美元左右,相比之下OpenAI等公司的同类项目成本要高出非常多。暂且不论DeepSeek的说法是否准确,其取得的突破都突显了AI开发领域的动态变化。
DeepSeek-R1最大的优势还在于它是开源模型,其开源仓库采用标准化、宽松的MIT License,完全开源、不限制商用、无需申请。因此,理论上所有的小参数模型均能够直接利用R1蒸馏出的标签数据,来增强推理性能,通过更改底层代码来改变其工作方式。
DeepSeek最新发布的一篇技术论文,主要内容是提出一种名为NSA(Natively Sparse Attention,原生稀疏注意力)的新型注意力机制,核心是通过对硬件的友好与端到端训练,取得推理、训练速度和任务表现的综合平衡:让大模型在长上下文中兼具高效与高保真度。用DeepSeek-R1彻底揭开了OpenAI无论如何都想藏起来的算法秘密,使让所有开发者都能看到推理是如何发生的,让AI的“思考过程”成为透明,给出更多复制和超越o1的可能。
此外,DeepSeek-R1有望提振整个开源社区的共建氛围,使得更多开源模型能够“站在巨人肩膀上”加速迭代,促进AI技Raspberry代理商术在各个领域的应用和普及,这就是开源的力量。
再次拥抱开源生态
反观OpenAI在ChatGPT问世后,则选择使用闭源模型的基础上通过「API+订阅制」构建起强大的商业护城河,通过API形式提供AI服务,而不开放底层权重,防止竞品复制其技术。更重要的是OpenAI能够掌控用户交互数据,持续迭代GPT模型和ChatGPT,并维持市场领先地位。
就在短短几个月前,企业几乎只能依赖GPT(OpenAI)、Claude(Anthropic)和 Gemini(Google)等大模型厂商提供的封闭API,现在,DeepSeek几乎以一举之力扭转了市场的注意力。随着高效的开源技术兴起,部分开发者和客户可能会转向更具性价比的开源解决方案。面对这一挑战,OpenAI的战略可能会发生重大转变,反映了AI领导者如何在日益多极化的AI世界中平衡创新、安全和商业化之间的关系。
不仅仅是OpenAI,整个AI生态都在拥抱开源:百度宣布下一代文心大模型4.5系列将在六月底开源;昆仑万维宣布开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,以及基于视频基座模型的表情动作可控算法SkyReels-A1;刚刚发布Grok 3系列模型的马斯克旗下xAI也宣布上一代大模型Grok 2将照例在几个月后开源。
虽然闭源AI依然能赚到钱,但随着DeepSeek带来的冲击,市场已经开始倾向于开源大模型的路线。开源不仅让整个行业面临的壁垒大幅削减,也给所有开发者和企业带来了更多自由度 —— API 接入、云端调用、本地部署,甚至是基于不同需求和数据进行重新训练。这也是为什么我们会看到,所有厂商似乎都在接入DeepSeek。当然,出于营销目的的接入以及简单粗暴的接入方式,也是这种变化中不可避免的一个过程。
这场AI竞赛,已经远远超出了最初的语言模型之争,开源路径带来的变化正在撬动整个AI生态,在一定程度上意味着大模型迭代的范式转变,而一场AI产业的「开源革命」也已然开始。在封闭体系下,企业只能被动接受巨头定价,这种逻辑一度被认为是不可逆的,毕竟打造大模型的成本极高,只有确保收益最大化才能维持技术优势。但DeepSeek彻底改变了这种假设,未来的AI可能也不会是少数巨头的垄断,而是由大量参与者共同推进的技术体系。
- 严防泄密!台积电果断拒绝为三星代工 Exynos 芯片
- OpenAI 每周活跃用户数量飙升至 3 亿 希望未来一年达 10 亿,用户增长迅速
- DeepSeek 引爆 AI 革命!国产 GPU 厂商集体亮剑,助力中国 AI 算力自主化
- 荣耀即将启动 IPO 流程,迈向资本市场新征程
- 强强联手!TOYOTA 携手英伟达,全球车市或将面临大洗牌,欧系车危矣
- 传马斯克的 "友商" 担心被报复 纷纷示好特朗普,行业动态
- CES 芯片大战:AMD 英伟达英特尔新品对决 性能参数曝光
- 马瑞利成功加冕,成为中国首家通过 SA8000 认证的外资汽车零部件企业
- 川普威胁?美媒分析:若上台针对台积电,美国制造恐自食恶果
- 智己官宣:正式取得 L4 无驾驶人智能网联汽车道路测试牌照,自动驾驶新进展
- RTX5070 Ti 性能缩水:ROP 单元缺失 游戏帧率下降 11%
- 新型生物材料与高端医疗器械广东研究院等加入 MathWorks 加速器合作项目
- 同轴连接器(射频) > 同轴连接器(RF)组件
- 嵌入式 > CPLD(复杂可编程逻辑器件)(集成
- 射频收发器 IC(射频和无线)
- 射频屏蔽(射频和无线)
- 可配置开关元器件 > 可配置开关基体(开关)
- 互锁开关(开关)
- 射频放大器(射频和无线)
- RF 定向耦合器(射频和无线)
- 嵌入式 > CPLD(复杂可编程逻辑器件)(集成
- 陶瓷电容器(电容器)
- 同轴连接器(射频) > 同轴连接器(RF)组件
- 通孔式电阻器(电阻器)
