大模型训练

一听到「AI to B」的叫卖声,1688就再也坐不住了

声明:本文来自于微信公众号 新莓daybreak,作者:翟文婷,授权站长之家转载发布。AI正在肉眼可见地泛化与下沉:有问必答,能陪聊,还是打工人给自己找的一个免费助理。见此情形,B 端商家有点急了。大模型如此全能,AI对一门生意的理解和经营,是不是也应该发挥点作用?只是跟C 端用户的拿来主义不同,AI提高B 端生产力的前提是懂这门生意,甚至可能需要进一步精调训练大模型。虽然「AI to B」好

谷歌新研究:合成数据助力大模型,数学推理能力提升八倍

近期,谷歌、卡内基梅隆大学与 MultiOn 的研究团队联合发布了一项关于合成数据在大模型训练中应用的新研究。根据 AI 发展科研机构 Epoch AI 的报告,目前人类公开的高质量文本训练数据大约有300万亿 tokens,但随着大型模型如 ChatGPT 的快速发展,对训练数据的需求正以指数级增长,预计在2026年前这些数据将被消耗殆尽,因此合成数据逐渐成为重要的替代方案。研究人员探索了合成数