近一个月,多款模型新品发布,包括生数科技模型Vidu更新至可一键生成32秒,支持音合成与4D生成;MiniMax发布海螺Hailuo-02,支持最高1080P、最长10秒的超清端到端生成;百度,模型热度并不算太高。瑞银研报认为,模型领域的竞争不会像大语言模型领域的竞争那样激烈,主要是受模型训练所需的语料内容所限。但同时,目前市面上由大厂与明星创业公司组成的战队,正在基础模型效率提高的背景下,加快产品更新与商业化落地。
近一个月的模型产品更新之前,Sora的热度已带动一批新品面世。包括2024年上半年的爱诗科技PixVerse、Runway Gen-3、Luma Dream Machine,下半年的生数科技Vidu、智谱清影、字节跳动PixelDance、MiniMax海螺等。
一方面,模型你追我赶。据AGI-Eval,2024年12月,PixVerse-V3、可灵1.5、Video-01的得分超越Sora。
但同时,受限于技术成熟度、商业化、成本高等因素,模型的创业热度并不及AI应用层,主要由大型互联网/科技企业组成,由爱诗科技、生数科技、Pika、Runway、MiniMax等明星创业公司补充。
此前,MiniMax创始人闫俊杰表示,类工作复杂度比文本更难,上下文文本很长,一个5秒的就有几M大小,但文本领域,5秒看100个字的大小可能都不到1K,这是几千倍的存储差距。该差距带来的挑战便是如果通过基本构建的底层基础设施来处理、清洗、标注数据。另外,闫俊杰称,开源内容没那么多,需要付出的耐心更大。
首个被称为“中国版Sora”的生数科技也在今年进行了更新,此前轮次中,蚂蚁集团、BV百度风投、启明创投等机构押注生数。对于投资人对模型的判断,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军对表示,早期孵化看团队质量,中后期看团队技术与商业化能力。
一位一级市场关注AI领域的投资人对表示,近期一家刚披露千万月活用户规模的模型平台,尝试向一级市场讲述做模型领域TikTok的“故事”,但投资人暂未买账,“成本压力与商业变现之间的鸿沟太大了,”该投资人称。
曾参与投资Perpleixty 、Character.ai、Mistral、Harvy以及Pika等AI 初创公司的硅谷Solo VC 投资人Elad Gil此前表示,现今模型类型琳琅满目,但从资金角度来看,大部分投资可能会流向模型公司,因为它们资金需求更大。但在数量上,行业将看到更多应用程序开发公司,而非基础模型公司。
具体落地方式上,目前大模型收费模式主要包括API、订阅、广告、定制化四种。从AI产品商业化程度来看,B端变现模式更加清晰,C端在国内市场多以免费为主,海外市场以付费模式为主。
模型也主要分为To C端与To B端两种服务模式,前者主要提供付费订阅服务,如快手可灵、字节即梦、智象未来等,通过免费版、标准版、高级版、尊享版等不同等级订阅服务收费,价格每月数元到数百元不等。后者主要通过API接口和解决方案服务形式收费,如快手可灵、生数科技、爱诗科技等,服务领域涵盖影视、互联网、营销广告等,每月收费数十元至数万元不等。
6月6日,快手披露可灵AI在正式上线的第十个月突破一亿美元ARR,月度付费金额在今年四月和五月连续突破一亿元人民币。除了可灵AI,其他模型厂商暂未披露明确的营收数据,头部平台以数千万美元的ARR规模为主。以可灵AI为例,据高盛研报,2P/2C订阅收入占可灵AI总收入的70%,2B API调用占30%。
生数产品方面,朱军表示,目前主要有SaaS和MaaS两种形态,前者数千万C端用户,主要是专业和半专业创MiniMax模型商业化也分为B端与C端。前者通过提供API接口服务,将生成能力输出给企业客户,支持多种应用场景,如影视制作、广告创意、教育内容生成等。后者支持用户通过简单指令生成高质量,平台提供会员积分制在内的多种付费方案。今年6月下旬,MiniMax官方披露,从去年8月底发布海螺至今,已帮助创据研究机构Fortune Business Insights报告显示,2024年全球AI生成器市场规模达6.148亿美元,预计到2032年将增长至25.629亿美元,2025年至2032年间的年均复合增长率达20.0%,而大语言模型的预估增长率约35.92%。
在可预见的增速范围内,朱军认为今年大模型商业化就会加快,市场对类消费与需求非常广阔,这也是赛道与文字赛道不一样的地方。目前行业最头部大模型平台都有各自的特色与商业化路径,没有走到类似大语言模型那样“卷”的状态,暂时也不会出现一家独大的局面。