您现在的位置:主页 > 科技 >

科大讯飞:已关注DeepSeek - V3混合专家架构技术进展,并将持续推动算法迭代

标签: 日期:2025-01-28 15:02来源:未知作者:admin
有投资者在互动平台向科大讯飞提问:DeepSeek - V3 采用了创新的混合专家架构,总参数达到 6710 亿,成为目前最大的开源模型 。但令人惊叹的是,在实际运行中,每个 token 仅激活 370 亿参数,这一巧妙的设计大大降低了计算资源的需求,提高了资源利用效率。

  有投资者在互动平台向科大讯飞提问:DeepSeek - V3 采用了创新的混合专家架构,总参数达到 6710 亿,成为目前最大的开源模型 。但令人惊叹的是,在实际运行中,每个 token 仅激活 370 亿参数,这一巧妙的设计大大降低了计算资源的需求,提高了资源利用效率。这种架构创新,就好比为模型打造了一个智能的资源分配系统,请问讯飞有这样的技术吗?

   公司回答表示:科大讯飞已经关注到上述技术进展,我们会持续推动算法迭代,让自主可控的星火大模型在自主可控的算力平台上持续进化提升。

顶一下
(0)
0%
踩一下
(0)
0%
相关文章
共有人强势围观,期待你的评论!评论区
小提示: 本站的评论不需要审核,即发即显,有什么话你就尽管说吧,但不要过激哦,以免遭跨省处理!

验证码:点击我更换图片 匿名评论
最新评论