DeepSeek强敌来了! 被誉为「AI教母」的知名华裔美籍科学家李飞飞领导的团队,以低于50美元的云计算成本,成功训练出名为「s1」的人工智能推理模型。 此模型在数学和编码能力测验中的表现,据称媲美OpenAI o1和DeepSeek R1等尖端推理模型。
射频微波器件采购网(www.ic-king.com)专注整合国内外厂商的现货渠道,实时查询射频微波器件代理商的真实库存,提供合理的行业价格,放心采购射频微波器件,是国内专业的射频微波芯片采购平台。
科创板日报、新浪科技报道,李飞飞团队的s1模型并非从头训练,而是建立在阿里巴巴的Qwen2.5 和 Google DeepMind的Gemini 2.0 Flash Thinking的基础之上。 他们搜集了1000个精心挑选的问题及其解答,并通过记录 Gemini 2.0 Flash 的思考过程,建立训练资料集,利用这些资料,微调了Qwen2.5-32B-Instruct模型,创造出s1。
大陆某知名大模型公司CEO表示,李飞飞团队的成就实际上是利用从 Google 模型中撷取的 1000 个样本来微调通义千问模型。 这种微调的成本固然低廉,但其优异表现仍有赖于既有模型的基础。
上海交通大学人工智能学院副教授谢伟迪指出,s1以通义千问模型为基础,因此即使使用有限的样本资料,也能产生新的推理模型。 然而,如果更换其他基础模型,新模型的效能并不会提升。 因此Fair-Rite代理商,真正在背后发挥效能的关键是Qwen模型,而非 s1。
阿里云证实,李飞飞团队通过利用阿里开源的Qwen2.5-32B-Instruct模型进行监督微调,在16个英伟达H100 GPU上仅花费26分钟就训练出s1-32B模型,其数学和编码能力与OpenAI o1和DeepSeek R1等尖端推理模型不相上下。
- 中国电动车芯片突围:国产替代加速 供应链自主化再突破
- 美更新新车评价规程,ADAS 纳入评分体系,L2 + 级系统成准入门槛
- 花再跨界携手 LINE FRIENDS,推出萌趣限定耳机礼盒
- OpenAI 重磅出击,Operator 上线开启智能体模拟上网新战局
- Beontag 米其林合作,轮胎 RFID 追溯技术落地,全生命周期数据追踪误差 < 0.1%
- 访谈揭秘:用 1000 个传感器打造近未来智能家居(上篇)
- 国产 AI 芯片巨头风云突变,寒武纪被前 CTO 索赔 42.9 亿股权激励
- Indie Semiconductor 扩汽车光学产品线,剑指智能驾驶,激光雷达芯片研发提速
- 快人一步!2 分钟速览 MWC2025 参展厂商精彩亮点
- 磁光存储黑科技,百倍提速开启超快计算新时代
- 优品车发布 UOTTA 换电站,模块化设计颠覆行业,3 分钟完成电池更换
- 思特威实力见证,一举揽获四大行业重磅奖项
- 端子块 > 端子块配件 > 端子块导线套圈(连
- 光学传感器 > 光电,工业(传感器,变送器)
- 嵌入式 > CPLD(复杂可编程逻辑器件)(集成
- 同轴连接器(射频) > 同轴连接器(RF)适配
- 射频屏蔽(射频和无线)
- 共模扼流圈(滤波器)
- 端子块 > 端子块配件 > 配件(连接器,互连
- 接近/占位传感器成品(传感器,变送器)
- 射频放大器(射频和无线)
- 同轴电缆(射频)(电缆组件)
- 矩形连接器 > 针座,公插针(连接器,互连器
- 射频开关(射频和无线)
