
OpenAI上一次开源大语言模型,已经是2019年的事情了:11月6日,OpenAI正式发布了GPT-2最后一个部分的完整代码,其中包括含有15亿参数的最大版本。然而,自OpenAI于2022年年底推出ChatGPT以来,从GPT-3再到最新的OpenAI o3-mini都再也没有开源过。但OpenAI成立时表示是为了推动AI的安全性和有益发展,确保AI的发展能够被广泛共享,并且对全人类都是有益的。因此很多人调侃让OpenAI改名为“CloseAI”。
DeepSeek横空出世后,Sam Altman在被问及OpenAI是否会公开部分AI模型技术并展示更多系统工作原理的研究时,他表示公司内部正在讨论这种可能性,承认OpenAI此前在开源策略上可能“站在了历史的错误一边”,称正在讨论公开AI模型权重。不过他也指出,公司内部并非所有人都认同这一观点,而且这也不是当前的首要任务,最重要的是继续按研究规划推进工作。
DeepSeek为何能成为爆款?
DeepSeek日前发布的大模型DeepSeek-R1,各项性能与OpenAI的GPT-4o持平?,仅用时两个月就完成了训练,同时过程中仅用了2000个英伟达H800 GPU,其他主流AI实验室通常需要部署的芯片数量估计超过10000个 —— 展现出算法创新和架构优化可能比算力更重要,对建立在海量计算资源独占之上的整体商业模式形成了威胁。值得注意的是,其大幅降低了AI计算成本,约为550万美元左右,相比之下OpenAI等公司的同类项目成本要高出非常多。暂且不论DeepSeek的说法是否准确,其取得的突破都突显了AI开发领域的动态变化。
DeepSeek-R1最大的优势还在于它是开源模型,其开源仓库采用标准化、宽松的MIT License,完全开源、不限制商用、无需申请。因此,理论上所有的小参数模型均能够直接利用R1蒸馏出的标签数据,来增强推理性能,通过更改底层代码来改变其工作方式。
DeepSeek最新发布的一篇技术论文,主要内容是提出一种名为NSA(Natively Sparse Attention,原生稀疏注意力)的新型注意力机制,核心是通过对硬件的友好与端到端训练,取得推理、训练速度和任务表现的综合平衡:让大模型在长上下文中兼具高效与高保真度。用DeepSeek-R1彻底揭开了OpenAI无论如何都想藏起来的算法秘密,使让所有开发者都能看到推理是如何发生的,让AI的“思考过程”成为透明,给出更多复制和超越o1的可能。
此外,DeepSeek-R1有望提振整个开源社区的共建氛围,使得更多开源模型能够“站在巨人肩膀上”加速迭代,促进AI技Raspberry代理商术在各个领域的应用和普及,这就是开源的力量。
再次拥抱开源生态
反观OpenAI在ChatGPT问世后,则选择使用闭源模型的基础上通过「API+订阅制」构建起强大的商业护城河,通过API形式提供AI服务,而不开放底层权重,防止竞品复制其技术。更重要的是OpenAI能够掌控用户交互数据,持续迭代GPT模型和ChatGPT,并维持市场领先地位。
就在短短几个月前,企业几乎只能依赖GPT(OpenAI)、Claude(Anthropic)和 Gemini(Google)等大模型厂商提供的封闭API,现在,DeepSeek几乎以一举之力扭转了市场的注意力。随着高效的开源技术兴起,部分开发者和客户可能会转向更具性价比的开源解决方案。面对这一挑战,OpenAI的战略可能会发生重大转变,反映了AI领导者如何在日益多极化的AI世界中平衡创新、安全和商业化之间的关系。
不仅仅是OpenAI,整个AI生态都在拥抱开源:百度宣布下一代文心大模型4.5系列将在六月底开源;昆仑万维宣布开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,以及基于视频基座模型的表情动作可控算法SkyReels-A1;刚刚发布Grok 3系列模型的马斯克旗下xAI也宣布上一代大模型Grok 2将照例在几个月后开源。
虽然闭源AI依然能赚到钱,但随着DeepSeek带来的冲击,市场已经开始倾向于开源大模型的路线。开源不仅让整个行业面临的壁垒大幅削减,也给所有开发者和企业带来了更多自由度 —— API 接入、云端调用、本地部署,甚至是基于不同需求和数据进行重新训练。这也是为什么我们会看到,所有厂商似乎都在接入DeepSeek。当然,出于营销目的的接入以及简单粗暴的接入方式,也是这种变化中不可避免的一个过程。
这场AI竞赛,已经远远超出了最初的语言模型之争,开源路径带来的变化正在撬动整个AI生态,在一定程度上意味着大模型迭代的范式转变,而一场AI产业的「开源革命」也已然开始。在封闭体系下,企业只能被动接受巨头定价,这种逻辑一度被认为是不可逆的,毕竟打造大模型的成本极高,只有确保收益最大化才能维持技术优势。但DeepSeek彻底改变了这种假设,未来的AI可能也不会是少数巨头的垄断,而是由大量参与者共同推进的技术体系。
- NVIDIA 勾勒未来 GPU 架构蓝图:Rubin 与 Feynman 架构引领技术变革
- 比亚迪白菜价技术:改写全球车市格局 单车智能成本降 60%
- 益莱储 2025 战略升级!租赁赋能客户创新,半导体设备周转效率提升 60%
- 【解码 CITE2025】全球数字化变局中的 "中国突围":本土科技巨头如何重构产业新生态
- BOE(京东方)携手京东,在 AWE 2025 推动百吋电视普及,引领家庭视听新趋势
- 马斯克发布 Grok3:最强 AI 现场演示 逻辑推理能力碾压人类
- 鸿海 5000 万收购歌尔越南!AirPods Pro 3 产能保障,成本降低 15%
- 英飞凌发布 <2025 年 GaN 功率半导体预测报告>,洞察行业未来
- 高通骁龙 8s 至尊版芯片曝光:配置接近骁龙 8s Gen 3,剑指中高端市场
- 三星 SK 海力士弃用中国 EDA:供应链大地震 国产替代迫在眉睫
- 三星 S25 放弃自家内存!美光成首要供应商,LPDDR5X 产能吃紧
- 意大利、奥地利和波兰呼吁调整 2025 年欧盟二氧化碳排放法规
嵌入式 > FPGA(现场可编程门阵列)(集成电
RF 配件(射频和无线)
RF 其它 IC 和模块(射频和无线)
射频收发器模块和调制解调器(射频和无线)
射频混频器(射频和无线)
数据采集(DAQ)(测试与计量)
同轴电缆(射频)(电缆组件)
开关配件(开关)
陶瓷电容器(电容器)
端子块 > 针座、插头和插座(连接器,互连器
白色 LED 照明(光电器件)
同轴连接器(射频) > 同轴连接器(RF)组件























