AI热点 3月前 207 浏览次数 10 评论

DeepSeek-V3 & R1 合体:快手开源 "Auto Think" 大模型,可根据问题自动调节思考深度

发布了 1221 文章

感谢IT之家网友 软媒新友2178118 的线索投递!

IT之家 6 月 4 日消息,快手 Kwaipilot 团队近日开源了 KwaiCoder-AutoThink-preview 自动思考大模型,针对近期深度思考大模型存在的“过度思考”问题进行了深入研究。团队提出了一种全新的自动思考模型训练范式,同时基于传统强化学习算法(GRPO),提出了带有过程监督的强化学习方法 Step-SRPO,以进一步提升模型在复杂任务中的表现。

据介绍,该模型融合了“思考”和“非思考”能力,号称“DeepSeek-V3 & R1 合体”,具备根据问题难度自动切换思考形态的能力。通过进行这种思考形态训练,模型在多个“思考”和“非思考”评测榜单上均实现了性能提升,其中在部分代码和数学类的任务上,开启自动思考模式下的模型得分提升高达 20 分左右。官方表示,在部分榜单中,即使模型没有开启思考模式,受益于更优的推理形态,性能也有小幅上涨。

快手技术表示,Kwaipilot 未来将基于 preview 版本模型,进一步增强推理能力,支持更完善的思考中工具使用能力,也会将全部技术细节、训练方法开源。IT之家附模型开源地址:

https://huggingface.co/Kwaipilot/KwaiCoder-AutoThink-preview

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

1221 文章 178813 浏览次数 5638 粉丝

评论 (10)

User avatar

快手这波“Auto Think”挺有意思,深度思考还能调节!

User avatar

这波“Auto Think”,我有点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点

User avatar

感觉快手在用AI来挑战人类的智商,挺有意思的

User avatar

这波操作,有点像给AI喂饭,看看它怎么消化

User avatar

感觉快手在研究人类的思维模式,挺有意思的

User avatar

这玩意儿,挺有意思的,有点像看戏

User avatar

我猜他们想看看AI能想出什么奇奇怪怪的答案

User avatar

感觉快手在用AI来玩贫民窟的脑洞,有点意思

User avatar

这算什么深度思考?纯粹是让机器在胡思乱想

User avatar

这波快手“Auto Think”有点意思,像个智商测试,挺有新意的

睡觉动画