
OpenAI上一次开源大语言模型,已经是2019年的事情了:11月6日,OpenAI正式发布了GPT-2最后一个部分的完整代码,其中包括含有15亿参数的最大版本。然而,自OpenAI于2022年年底推出ChatGPT以来,从GPT-3再到最新的OpenAI o3-mini都再也没有开源过。但OpenAI成立时表示是为了推动AI的安全性和有益发展,确保AI的发展能够被广泛共享,并且对全人类都是有益的。因此很多人调侃让OpenAI改名为“CloseAI”。
DeepSeek横空出世后,Sam Altman在被问及OpenAI是否会公开部分AI模型技术并展示更多系统工作原理的研究时,他表示公司内部正在讨论这种可能性,承认OpenAI此前在开源策略上可能“站在了历史的错误一边”,称正在讨论公开AI模型权重。不过他也指出,公司内部并非所有人都认同这一观点,而且这也不是当前的首要任务,最重要的是继续按研究规划推进工作。
DeepSeek为何能成为爆款?
DeepSeek日前发布的大模型DeepSeek-R1,各项性能与OpenAI的GPT-4o持平,仅用时两个月就完成了训练,同时过程中仅用了2000个英伟达H800 GPU,其他主流AI实验室通常需要部署的芯片数量估计超过10000个 展现出算法创新和架构优化可能比算力更重要,对建立在海量计算资源独占之上的整体商业模式形成了威胁。值得注意的是,其大幅降低了AI计算成本,约为550万美元左右,相比之下OpenAI等公司的同类项目成本要高出非常多。暂且不论DeepSeek的说法是否准确,其取得的突破都突显了AI开发领域的动态变化。
DeepSeek-R1最大的优势还在于它是开源模型,其开源仓库采用标准化、宽松的MIT License,完全开源、不限制商用、无需申请。因此,理论上所有的小参数模型均能够直接利用R1蒸馏出的标签数据,来增强推理性能,通过更改底层代码来改变其工作方式。
DeepSeek最新发布的一篇技术论文,主要内容是提出一种名为NSA(Natively Sparse Attention,原生稀疏注意力)的新型注意力机制,核心是通过对硬件的友好与端到端训练,取得推理、训练速度和任务表现的综合平衡:让大模型在长上下文中兼具高效与高保真度。用DeepSeek-R1彻底揭开了OpenAI无论如何都想藏起来的算法秘密,使让所有开发者都能看到推理是如何发生的,让AI的“思考过程”成为透明,给出更多复制和超越o1的可能。
此外,DeepSeek-R1有望提振整个开源社区的共建氛围,使得更多开源模型能够“站在巨人肩膀上”加速迭代,促进AI技Raspberry代理商术在各个领域的应用和普及,这就是开源的力量。
再次拥抱开源生态
反观OpenAI在ChatGPT问世后,则选择使用闭源模型的基础上通过「API+订阅制」构建起强大的商业护城河,通过API形式提供AI服务,而不开放底层权重,防止竞品复制其技术。更重要的是OpenAI能够掌控用户交互数据,持续迭代GPT模型和ChatGPT,并维持市场领先地位。
就在短短几个月前,企业几乎只能依赖GPT(OpenAI)、Claude(Anthropic)和 Gemini(Google)等大模型厂商提供的封闭API,现在,DeepSeek几乎以一举之力扭转了市场的注意力。随着高效的开源技术兴起,部分开发者和客户可能会转向更具性价比的开源解决方案。面对这一挑战,OpenAI的战略可能会发生重大转变,反映了AI领导者如何在日益多极化的AI世界中平衡创新、安全和商业化之间的关系。
不仅仅是OpenAI,整个AI生态都在拥抱开源:百度宣布下一代文心大模型4.5系列将在六月底开源;昆仑万维宣布开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,以及基于视频基座模型的表情动作可控算法SkyReels-A1;刚刚发布Grok 3系列模型的马斯克旗下xAI也宣布上一代大模型Grok 2将照例在几个月后开源。
虽然闭源AI依然能赚到钱,但随着DeepSeek带来的冲击,市场已经开始倾向于开源大模型的路线。开源不仅让整个行业面临的壁垒大幅削减,也给所有开发者和企业带来了更多自由度 API 接入、云端调用、本地部署,甚至是基于不同需求和数据进行重新训练。这也是为什么我们会看到,所有厂商似乎都在接入DeepSeek。当然,出于营销目的的接入以及简单粗暴的接入方式,也是这种变化中不可避免的一个过程。
这场AI竞赛,已经远远超出了最初的语言模型之争,开源路径带来的变化正在撬动整个AI生态,在一定程度上意味着大模型迭代的范式转变,而一场AI产业的「开源革命」也已然开始。在封闭体系下,企业只能被动接受巨头定价,这种逻辑一度被认为是不可逆的,毕竟打造大模型的成本极高,只有确保收益最大化才能维持技术优势。但DeepSeek彻底改变了这种假设,未来的AI可能也不会是少数巨头的垄断,而是由大量参与者共同推进的技术体系。
- 晶圆代工:先进制程大战一触即发,谁将脱颖而出?
- 智能家居下篇:1000 传感器构建未来生活,华为鸿蒙智家生态全解析
- SK 海力士完成 90 亿美元收购,英特尔闪存业务尘埃落定
- Mate 70 系列发布第二代灵犀通信,真的「绝对对得起那四个字」
- IAR 加入 Zephyr 项目成为银牌会员,强化开源协作坚定承诺
- 威灵汽车部件再提速:美的速度持续领跑 电机产能扩张 50%
- elexcon2025 前瞻:元器件行情与趋势解码 碳化硅 / AI 芯片成焦点
- 台积电前董事长称“技术移美,将损失几百亿”,台媒:问题是能躲得掉吗?
- 中国电动车芯片突围:国产替代加速 供应链自主化再突破
- 苹果百度深化合作,中国 iPhone AI 功能升级,本地化语音助手年内上线
- 竞争加剧!报道称亚马逊劝说云客户远离英伟达,改用自家芯片
- DeepSeek 带火 AI 融资:春节后 12 家企业获投超 50 亿
固定电感器(电感器,线圈,扼流圈)
瞬态电压抑制器(TVS) > TVS 二极管(电路保护)
接口 > 电信(集成电路(IC))
嵌入式 > FPGA(现场可编程门阵列)(集成电路(IC))
晶闸管 > SCR 模块(分立半导体)
端子块 > 线对板(连接器,互连器件)
射频开关(射频和无线)
晶体管 > FET,MOSFET > 单 FET,MOSFET(分立半导体)
保险丝(电路保护)
端子块 > 线对板(连接器,互连器件)
评估板 > 射频评估和开发套件,板(开发板,套件,编程器)
电源管理(PMIC) > 监控器(集成电路(IC))























