图片来源:David AI Labs
David AI Labs 这家初创公司通过出售音频数据集来帮助训练人工智能模型,近期在新一轮融资中从投资者处筹集了 5000 万美元——这表明为 AI 开发提供基础构件的初创企业市场正在不断增长。
据知情人士透露,David AI 由 Scale AI 前员工 Tomer Cohen 和 Ben Wiley 联合创立,最新一轮融资后估值已达 5 亿美元(包含本轮融资金额)。该估值较短短数月前 2500 万美元融资轮时投资者给出的估值增长了约四倍。
David AI 的本轮投资方包括领投的硅谷投资公司 Meritech Capital,以及英伟达旗下的 NVentures 风投部门。该公司表示,现有投资者 First Round Capital、Y Combinator、Alt Capital 和 Amplify Partners 也参与了本轮融资。
该初创公司是致力于收集和销售AI 模型开发所需数据的众多企业之一。但与 Scale AI 和 Surge Labs 等,其他领先数据标注初创公司主要创建文本数据不同,David AI 押注音频数据将日益重要。
多家大型 AI 公司已开始超越纯文本聊天机器人,向语音助手、可穿戴 AI 设备和机器人等产品领域推进。
David AI 首席执行官科恩表示:"我们认为要真正做好音频,就需要将其作为专注的全部重心。我们整天思考的是:如何设计音频数据集、如何测试、如何收集。我们公司的全部力量都投入于此。"
David AI 通过支付数千名贡献者报酬来录制原始语音,专门用于训练 AI 模型,从而创建定制音频数据。该公司联合创始人 Cohen 表示,包括所谓的"科技七巨头"上市公司、领先的 AI 基础模型实验室以及小型初创企业在内的多家机构已成为客户。
David AI 今年早些时候宣布公司年度经常性收入已突破 1000 万美元 。Cohen 称这一数字此后已大幅增长。
Meritech 合伙人 Alex Kurland 表示:"该公司目前需求激增,几乎应接不暇",并补充说他相信音频数据将成为一个巨大市场。"这项业务在运营和技术上都极其复杂,而他们是唯一真正取得进展的团队。"
在创建音频数据集之前,David AI 团队通常会花时间评估领先 AI 模型的性能缺陷——这些不足可能源于缺乏高质量的音频数据。例如,许多音频 AI 模型不擅长与用户建立融洽关系,部分原因是它们缺乏陌生人之间自然交谈并随时间发展关系的示例。为此,科恩团队将互不相识的人类贡献者配对,长期记录他们的对话过程。
"如果能向模型展示这一系列对话过程,以及友谊形成的样貌,"科恩表示,"模型就会开始学习模仿这种行为。"
David AI 总部位于旧金山,目前拥有约 25 名全职员工。公司计划利用本轮融资扩大团队规模。
参考资料
https://www.bloomberg.com/news/articles/2025-10-08/david-ai-raises-50-million-to-bring-audio-data-to-ai-models?srnd=phx-technology
编译:ChatGPT
文章来自于微信公众号 “Z Potentials”,作者 “Z Potentials”