多样的音乐创作玩法、不断优化的模型效果,让音乐大模型成为今年垂直大模型赛道的一大亮点。
今年3月,音乐生成模型Suno V3面世,被一些业界人士称为音乐行业的“ChatGPT时刻”。最近,Suno发布V4版本,允许用户生成音质更高、更好听、时长达4分钟的音乐。这意味着,AI可以创作一首完整的歌曲。
不仅是Suno,国内AI音乐领域的资深“玩家”们也纷纷入局。在Suno V3发布后,国内大模型厂商纷纷上线类似产品,形成“群雄逐鹿”的格局。
产品层出不穷
记者梳理发现,目前国内AI音乐大模型企业主要有三类:以字节跳动豆包旗下海绵音乐为代表的大型科技公司,以昆仑万维旗下的天工SkyMusic为代表的新兴大模型厂商,以及以趣丸科技旗下的天谱乐为代表的垂直赛道公司。
海绵音乐主打利用AI技术帮助用户生成个性化音乐作品。用户只需输入一句灵感或上传一张图片,即可生成专属音乐作品。相比Suno,海绵音乐生成的中文歌曲吐字清晰度和演唱流畅性更高,曲风更符合国人喜好。
天工SkyMusic基于昆仑万维“天工3.0”超级大模型打造,能够生成多种风格的音乐作品。它采用音乐音频领域类Sora模型架构,支持生成80秒44100赫兹采样率双声道立体声歌曲。
天谱乐于今年7月发布,是一个多模态配乐大模型。它集成图片理解算法、旋律生成算法、视频理解算法、配器识别算法等技术。值得注意的是,天谱乐不仅支持文生音乐、音频生音乐,还具备图片、视频生成音乐的功能。
此外,腾讯音乐和网易云音乐也推出了相关产品。
落地场景广泛
业内普遍认为,与全球巨头同场竞技,AI应用是国内人工智能企业的优势所在。国内市场需求大、可落地的商业化场景多,为国产大模型进化提供了坚实基础。
在趣丸科技副总裁贾朔看来,“降低门槛让普通用户体验音乐创作的乐趣”是自研产品的出发点,而这样的策略也的确奏效。数据显示,目前已有4600万人注册使用趣丸科技旗下的唱鸭App或天谱乐官网,累计创作近1000万首AI歌曲。
影视制作等专业从业者的应用,也为音乐大模型落地提供了更多商业化场景。一方面,音乐大模型可以帮助专业音乐人提升创作效率,让快速创作和试验新的音乐构想成为可能;另一方面,在短视频浪潮下,音乐大模型正在辅助短视频创作者创造出更符合视频内容的背景音乐,提升内容质量和受众体验。
推广遭遇挑战
尽管音乐大模型在以前所未有的速度“狂飙”,但推广应用尚面临一些难题。
高质量的音乐生成模型依赖高质量的音乐音频数据进行训练,但这些音乐音频数据的版权问题不容忽视。今年6月,环球音乐集团、索尼音乐集团和华纳音乐集团等多家唱片公司对Suno等AI音乐公司发起诉讼,称它们未经授权使用版权音乐来训练AI模型并对外提供服务。对此,Suno进行回击,指责唱片公司滥用版权诉讼,企图借此维护自己在AI音乐市场的主导地位。如何在法律框架内实现高质量音乐音频数据的运营和商业化,是AI音乐公司未来必须思考的问题。此外,音乐大模型生成的音乐作品是否享有版权保护,其版权归属如何界定,尚无明确的法律规定,这给音乐大模型的应用带来了不确定性。
贾朔认为,可以利用技术手段规避一些纷争。比如在产品侧,当用户在使用AI创作时,可利用相关技术判断其是否有模仿现有艺术家作品的主观意图,并视情况做出弹窗提示。
同时,音乐的创意与情感是否可以被大模型实现也有待验证。如何提升大模型的创意能力,使其能创作出更具个性和创新性的音乐作品,是当前音乐大模型需要突破的方向之一。
此外,AI音乐“演唱者”的声音距离真人也有一定距离,解决这一问题需要相应的技术手段。昆仑万维董事长方汉说,天工SkyMusic通过自研模型技术,实现乐器、人声、旋律、音量、音符的一体化端到端生成,在人声合成、情感表达等方面具有一定优势。