您现在的位置:主页 > 发展 >

中国电信发布语音识别大模型,支持30种方言混说

标签: 日期:2024-06-02 08:02来源:未知作者:admin
中国电信人工智能研究院于近日发布了业内首个支持30种方言自由混说的语音识别大模型星辰超多方言语音识别大模型,可同时识别理解粤语、上海线多种方言,是目前国内支持最多方言的语音识别大模型。 据悉,中国电信人工智能研究院已构建超30种、超30万小时的高

  中国电信人工智能研究院于近日发布了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,可同时识别理解粤语、上海线多种方言,是目前国内支持最多方言的语音识别大模型。

  据悉,中国电信人工智能研究院已构建超30种、超30万小时的高质量方言数据库,研发团队采用的“蒸馏+膨胀”联合训练算法可解决超大规模多场景数据集和大规模参数条件下预训练坍缩的问题,实现1B参数80层模型稳定训练。中国电信方面表示,星辰语音大模型是业内首个开源的、基于离散语音表征的语音识别大模型,通过“从语音到token再到文本”的建模新范式,将推理时语音传输比特率大幅降低。

  据中国电信方面透露,星辰语音大模型现已对外开源及应用落地,在福建、江西、广西、北京、内蒙古等地的中国电信万号智能客服试点应用。大模型方面,除了上述语音识别大模型,中国电信还发布了星辰海纳视联大模型。据天翼视联科技有限公司总经理边延风介绍,天翼视联的视联网应用日益丰富,SaaS应用加载超1400个,openAPI月调用次数超30亿次。

顶一下
(0)
0%
踩一下
(0)
0%
相关文章
共有人强势围观,期待你的评论!评论区
小提示: 本站的评论不需要审核,即发即显,有什么话你就尽管说吧,但不要过激哦,以免遭跨省处理!

验证码:点击我更换图片 匿名评论
最新评论