腾讯AI团队推出了一款令人振奋的AI唱歌模型LeVo,以其强大的音色克隆、分轨生成和高保真音乐表现引发业界热议。据悉,LeVo在多项关键指标上可媲美行业领先的Suno4.5,为中国AI音乐生成技术赢得一席之地。AIbase整理最新信息,为您深度解析LeVo的突破性功能与潜力。
媲美Suno4.5:LeVo的硬核实力
LeVo由腾讯AI实验室研发,采用语言模型(LM)架构,结合LeLM和音乐编解码器,能够并行生成混合音轨(融合人声与伴奏)或双轨音轨(人声与伴奏分开)。在音乐性、音质、人声与伴奏和谐度以及歌词对齐等维度上,LeVo全面超越现有开源学术模型。根据最新评测,LeVo在歌词对齐能力(LYC)上比Suno4.5高出0.21分,展现出卓越的文本控制能力。
项目地址:https://levo-demo.github.io/
零样本音色克隆:个性化音乐创作新高度
LeVo支持零样本音色克隆(Zero-Shot Voice Cloning),仅需3秒音频片段即可精准复制目标音色,包括音调、情感和韵律。这一功能无需大量训练数据,极大降低了音乐创作的技术门槛。无论是为个人定制专属音色,还是模仿知名歌手风格,LeVo都能提供自然流畅的生成效果,赋予创作者无限可能。
分轨生成:专业音乐制作的利器
与传统AI音乐生成模型不同,LeVo支持双轨生成模式,可分别生成人声和伴奏音轨,为后期混音和编辑提供了更大灵活性。这一功能尤其适合专业音乐制作人,能够轻松实现高质量的分轨输出,优化创作流程。相比之下,Suno4.5在音色克隆和分轨支持上略显不足,LeVo的这一特性无疑为行业树立了新标杆。
高保真与多场景应用
LeVo在音质表现上接近Suno4.5的行业标准,尤其在音乐性、人声与伴奏和谐度和音质(MOS评分)等方面表现出色。尽管在歌曲结构清晰度上略逊于Suno4.5和Mureka-O1,但LeVo通过多偏好对齐方法优化了生成结果,确保音乐在各种风格和场景下都能保持高保真效果。无论是流行音乐、影视配乐还是广告制作,LeVo都能提供专业级输出。
开源承诺:推动AI音乐生态发展
腾讯表示,LeVo将以开源形式发布,计划提供完整代码和预训练模型,供全球开发者免费使用。这一举措不仅体现了腾讯在AI音乐领域的雄心,也为全球音乐创作社区注入了新的活力。AIbase注意到,LeVo的开源策略将有效降低创作门槛,助力内容创作者和音乐爱好者实现创意表达。
腾讯LeVo的发布标志着中国AI音乐生成技术迈向全球前沿,其零样本音色克隆和分轨生成功能为音乐创作带来了革命性突破。尽管在部分指标上与Suno4.5仍有差距,但LeVo凭借高性价比和开源优势,已成为AI音乐领域的强有力竞争者。AIbase认为,LeVo的推出不仅提升了中国AI技术的国际影响力,也为音乐创作的民主化进程迈出了重要一步。