“AI 教母” 挑战 DeepSeek！训练成本不到 50 美元，开源模型成新势力

轻松满足您的射频微波器件采购需求

整合全球优质射频微波芯片代理商现货渠道

聚焦知名射频微波器件品牌，强大的现货交付能力

“AI 教母” 挑战 DeepSeek！训练成本不到 50 美元，开源模型成新势力

（2026/6/8更新）

DeepSeek强敌来了！被誉为「AI教母」的知名华裔美籍科学家李飞飞领导的团队，以低于50美元的云计算成本，成功训练出名为「s1」的人工智能推理模型。此模型在数学和编码能力测验中的表现，据称媲美OpenAI o1和DeepSeek R1等尖端推理模型。

射频微波器件采购网(www.ic-king.com)专注整合国内外厂商的现货渠道，实时查询射频微波器件代理商的真实库存，提供合理的行业价格，放心采购射频微波器件，是国内专业的射频微波芯片采购平台。

科创板日报、新浪科技报道，李飞飞团队的s1模型并非从头训练，而是建立在阿里巴巴的Qwen2.5 和 Google DeepMind的Gemini 2.0 Flash Thinking的基础之上。他们搜集了1000个精心挑选的问题及其解答，并通过记录 Gemini 2.0 Flash 的思考过程，建立训练资料集，利用这些资料，微调了Qwen2.5-32B-Instruct模型，创造出s1。

大陆某知名大模型公司CEO表示，李飞飞团队的成就实际上是利用从 Google 模型中撷取的 1000 个样本来微调通义千问模型。这种微调的成本固然低廉，但其优异表现仍有赖于既有模型的基础。

上海交通大学人工智能学院副教授谢伟迪指出，s1以通义千问模型为基础，因此即使使用有限的样本资料，也能产生新的推理模型。然而，如果更换其他基础模型，新模型的效能并不会提升。因此Fair-Rite代理商，真正在背后发挥效能的关键是Qwen模型，而非 s1。

阿里云证实，李飞飞团队通过利用阿里开源的Qwen2.5-32B-Instruct模型进行监督微调，在16个英伟达H100 GPU上仅花费26分钟就训练出s1-32B模型，其数学和编码能力与OpenAI o1和DeepSeek R1等尖端推理模型不相上下。

您可能也感兴趣的新闻头条：