LeVo是什么
LeVo是腾讯AI实验室推出的AI唱歌模型,具备强大的音色克隆能力,仅需3秒音频即可精准复制目标音色,包括音调、情感和韵律,无需大量训练数据。LeVo支持分轨生成,可分别生成人声和伴奏音轨,为后期编辑提供便利。技术架构基于语言模型(LM),结合LeLM和音乐编解码器,能并行生成音轨,音质表现接近行业领先水平,在歌词对齐能力上表现卓越。

LeVo的主要功能
-
零样本音色克隆:仅需3秒音频片段即可精准复制目标音色,包括音调、情感和韵律,无需大量训练数据。
-
分轨生成:LeVo支持双轨生成模式,可分别生成人声和伴奏音轨,为后期混音和编辑提供了更大灵活性。
-
高保真音乐表现:LeVo在音质表现上接近行业领先水平,尤其在音乐性、人声与伴奏和谐度和音质(MOS评分)等方面表现出色。通过多偏好对齐方法优化生成结果,确保音乐在各种风格和场景下都能保持高保真效果。
LeVo的技术原理
- 语言模型架构:LeVo采用语言模型(LM)架构,结合LeLM和音乐编解码器,能并行生成高质量的音乐作品。
LeVo的性能表现
-
在多项关键指标上可媲美行业领先的Suno4.5。
-
在歌词对齐能力(LYC)上,LeVo比Suno4.5高出0.21分,展现出卓越的文本控制能力。
LeVo的项目地址
- 项目官网:https://levo-demo.github.io/
LeVo的应用场景
-
个人音乐创作者:为热爱音乐创作但缺乏专业技能的个人用户提供低门槛、高质量的音乐创作平台。
-
专业音乐制作人:分轨生成功能和高保真音乐表现能够提升创作效率和质量。
-
音乐教育机构:可用于为学生提供生动、有趣的音乐教学体验。