AI热点 2月前 230 阅读 0 评论

阿里开源 ZeroSearch 模型:可“自学”搜索能力,无需外部搜索引擎

作者头像

AI技术专栏作家 | 发布了 246 篇文章

阿里开源 ZeroSearch 模型:可“自学”搜索能力,无需外部搜索引擎
阿里开源 ZeroSearch 模型:可“自学”搜索能力,无需外部搜索引擎
感谢IT之家网友 往事2016 的线索投递!

IT之家 5 月 9 日消息,阿里巴巴开源了 ZeroSearch 大模型,官方称其无需搜索即可激励搜索能力

IT之家附阿里对该模型的介绍大意如下:

我们提出了一种名为 ZeroSearch 的强化学习框架,通过不依赖真实搜索引擎来提升大型语言模型(LLM)的搜索能力。

在监督式微调的基础上,我们将 LLM 转化为一个能够生成相关或噪声文档的检索模块,响应查询。

为了更好地激发模型的推理能力,我们引入了课程化展开机制,通过让模型面对越来越复杂的检索任务,逐步培养其思考能力。

我们在多个领域内外的数据集上进行了大量实验,结果显示,ZeroSearch 在没有任何 API 费用的情况下,优于基于真实搜索引擎的模型

此外,它能够很好地在不同规模的基础型和指令微调型 LLM 上泛化,并支持多种强化学习算法。

官方披露的信息显示,在 7 大问答数据集评测中,其性能与谷歌搜索相当甚至实现超越(70 亿参数模型得分为 33.06 vs. 谷歌 32.47),且成本降低 87.93%。

通过 SerpAPI 使用谷歌搜索训练 64,000 个查询的费用大约为 586.70 美元,而使用 14B 参数的模拟 LLM 在四个 A100 GPU 上训练仅需 70.80 美元。

目前,ZeroSearch 已在 Qwen-2.5、LLaMA-3.2 等多个主流模型家族中完成验证。研究团队已将全部代码、数据集及预训练模型开源至 GitHub 和 Hugging Face。

开源地址:https://github.com/Alibaba-nlp/ZeroSearch

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!