AI热点 1年前 • 324 浏览次数 • 0 评论

苹果联合推出 AI 交错推理方法，Qwen2.5 模型响应速度快 80%、准确率提高 19.3%

发布了 1221 文章

IT之家 5 月 30 日消息，科技媒体 marktechpost 昨日（5 月 29 日）发布博文，报道称苹果公司携手杜克大学，提出交错推理（Interleaved Reasoning）的全新强化学习（Reinforcement learning，RL）方法，进一步提升大语言模型的推理能力。

主流大语言模型在处理多步复杂问题时，常采用“先思考后回答”的长链式推理方式。然而，这种方法存在两大痛点：一是响应时间过长，难以满足实时交互需求；二是早期推理步骤出错可能导致最终答案偏差。

研究人员指出，与人类在对话中随时分享部分想法不同，模型往往等到推理全部完成才输出结果，导致效率不高。

苹果公司携手杜克大学，研发了交错推理技术，让模型在推理过程中交替进行内部思考和输出中间答案（sub-answer），从而提升速度与实用性。

交错推理基于强化学习（RL）框架，采用特殊的训练模板，包含和 < answer> 标签，确保模型在达到关键推理节点时输出中间结果。

研究团队设计了基于规则的奖励机制，包括格式、最终准确率和条件性中间准确率，确保模型注重整体正确性。

测试中，交错推理在 Qwen2.5 模型（1.5B 和 7B 参数）上表现优异，响应速度提升超 80%，准确率提高高达 19.3%。

此外，该方法仅在问答（QA）和逻辑数据集上训练，却能在 MATH、GPQA、MMLU 等更具挑战性的基准测试中展现强大泛化能力。

研究还尝试了多种奖励策略，如全或无、部分积分和时间折扣奖励，其中条件性和时间折扣奖励效果最佳，显著优于传统方法。

IT之家附上参考地址

Interleaved Reasoning for Large Language Models via Reinforcement Learning

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

1221 文章 178813 浏览次数 5638 粉丝

评论 (0)

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

6月前 • AI热点

用户破8亿！GPT-5.1来了，表情包含量可自定义

用户破8亿！GPT-5.1来了，表情包含量可自定义

6月前 • AI热点

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI热点

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

6月前 • AI热点

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

6月前 • AI热点

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

6月前 • AI热点

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

6月前 • AI热点

小鹏物理AI的尽头，是马斯克的现金流

小鹏物理AI的尽头，是马斯克的现金流

6月前 • AI热点

热门标签

EvalsAPI NeurIPS DeepSeek/Qwen 龙哥3D建模 AIIaaS 一起来画画吧！大模型提供商 Coda 黄仁勋 GTC 2025 DAMOPANDA

热门作者

AI中国

AI中国

11569 文章 95.03万关注

钛媒体APP

钛媒体APP

1489 文章 0 关注

IT之家

IT之家

1221 文章 5.64K 关注

人人都是产品经理

人人都是产品经理

1210 文章 5.87万关注

AIbase基地

AIbase基地

1093 文章 9.63万关注