AI语音模型

​两名本科生打造 AI 语音模型,挑战谷歌 NotebookLM

在 AI 语音生成领域,竞争正变得愈发激烈。近日,来自韩国的两名本科生合伙创建了一款名为 Dia 的 AI 语音模型,声称其功能可与谷歌的 NotebookLM 相媲美。尽管这两位创始人在 AI 领域的经验尚浅,但他们在短短三个月内,成功开发出一款开放获取的语音生成工具。Dia 的训练依赖于谷歌的 TPU Research Cloud 项目,该项目为研究人员提供免费的 TPU AI 芯片使用权限。

亚马逊推出革命性 AI 语音模型 Nova Sonic,价格更具竞争力!

亚马逊近日发布了其最新的 AI 语音模型 ——Nova Sonic,这一新技术标志着该公司在人工智能语音领域的重要进展。Nova Sonic 能够快速处理语音输入并生成自然流畅的语音输出,其在速度、识别准确性以及对话质量等方面已达到了与 OpenAI 和谷歌等行业领军企业的顶尖水平。与其他 AI 语音模型相比,Nova Sonic 在性价比方面表现突出,价格竟然比 OpenAI 的 GPT-4o

亚马逊推新一代AI语音模型Nova Sonic,捕捉语气、语调变化和节奏

亚马逊近日推出了一款新型 AI 语音模型 ——Nova Sonic,旨在提升其语音助手 Alexa + 的性能。Nova Sonic 被设计用于本地处理语音并生成自然流畅的回复,标志着亚马逊在语音识别技术领域的又一次突破。Nova Sonic 采取了一种全新的整合方式,将语音理解和生成的能力统一到一个模型中。这一创新不仅简化了语音应用的开发过程,还能根据语音输入的声学背景(如语调和风格)来调整生成

MiniMax Audio推Speech- 02语音模型,一次性可以输入20万字符

备受关注的音频技术创新者MiniMax Audio正式发布了其全新的Speech-02系列语音模型,支持30多种语音,一次性可以输入20万字符。<!-- notionvc: fdae198d-f9e2-4313-bbcb-747cd4c93a10 -->为用户带来更真实、更流畅、更便捷的音频体验。全新的Speech-02系列是本次更新的核心亮点。据官方介绍,该系列在多语言覆盖能力上实现