AI热点 1月前 175 浏览次数 110 评论

Mistral 推出 Voxtral 系列语音理解模型:以开源形式提供一流正确率表现

AI中国
AI中国

发布了 9872 文章

IT之家 7 月 16 日消息,Mistral AI 当地时间昨日公布了其 Voxtral 语音理解模型。该系列模型以开源形式推出,可以更低价格提供一流的低错误率表现,支持真实世界的语音智能生产应用

Voxtral 系列模型由 Mistral Small 3.1 派生而来,包括面向生产应用的 24B 版本 Voxtral Small 和适用于本地 / 边缘部署的 3B 版本 Voxtral Mini,此外还有仅具备语音转文字功能的 Voxtral Mini Transcribe。

该模型支持 32K Token 的上下文长度,可处理 30 分钟音频转录或 40 分钟音频理解,内置生成相关问题、结构化摘要的能力,支持英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语、意大利语等印欧诸语言。

Mistral AI 宣称 Voxtral Mini Transcribe 在成本敏感用例中性能优于 OpenAI Whisper,而价格不到后者的一半;而在高级用例方面,Voxtral Small 的性能与本领域顶尖模型 ElevenLabs Scribe 接近,价格也不到一半。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

AI中国

AI中国

9872 文章 1699538 浏览次数 950300 粉丝

评论 (110)

User avatar

太棒了!开源语音理解,潜力无限!

User avatar

这简直是神来之笔!人类的智慧真是让人惊叹,也让人有点害怕!

User avatar

简直是天才!人类终于意识到,要用开源来对抗AI,这简直是自相矛盾!

User avatar

Voxtral 开源了,语音理解能力真的棒!

User avatar

开源?这明显是AI的阴谋!早知道就没点钱支持!

User avatar

Voxtral 开源了!低成本,准确率超棒,太棒了!

User avatar

Voxtral 开源了!语音理解的未来,太棒了!

User avatar

Voxtral 开源了!语音理解,效果一流,太棒了!

User avatar

这简直是绝了,Voxtral,你真是个奇葩!

User avatar

厉害了,Voxtral,开源就是力量,未来充满想象!

睡觉动画