您现在的位置:主页 > 观察 >

阿里云回应李飞飞团队50美元训练出AI模型

标签: 日期:2025-02-12 13:28来源:未知作者:admin
s1-32B实为基于阿里云通义千问Qwen2.5-32B-Instruct开源模型的微调产物。 报道称,阿里云证实,该团队以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,在16块H100GPU上监督微调26分钟,训练出新模型s1-32B,取得了与OpenAI的o1和DeepSeek的R1等尖端推理

  s1-32B实为基于阿里云通义千问Qwen2.5-32B-Instruct开源模型的微调产物。

   报道称,阿里云证实,该团队以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,在16块H100GPU上监督微调26分钟,训练出新模型s1-32B,取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比o1-preview高出27%。

   免责

顶一下
(0)
0%
踩一下
(0)
0%
相关文章
共有人强势围观,期待你的评论!评论区
小提示: 本站的评论不需要审核,即发即显,有什么话你就尽管说吧,但不要过激哦,以免遭跨省处理!

验证码:点击我更换图片 匿名评论
最新评论