清华大学

学术打假!清华上交大研究颠覆认知:强化学习竟是大模型推理的"绊脚石"

【研究颠覆】清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于未使用强化学习的原始模型。【实验验证】研究团队在数学、编码和视觉推理三大领域进行了系统性实验:数学任务:在GSM8K、MATH500等基准测试中,RL模型在低采样次数(k值)下准确率提升,但在高k值时问题覆盖

​清华大学推出全新 AI 辅修学位,助力学科交叉创新

根据最新消息,清华大学在经历了适度扩招和新书院的成立后,将于今年秋季学期推出一项全新的 AI 辅修学位。这一举措旨在吸引有志于将人工智能与各自学科相结合的学生,通过系统的课程设置,帮助他们掌握 AI 相关的知识和技能。图源备注:图片由AI生成,图片授权服务商Midjourney新设的 AI 辅修学位将对校内所有有意愿探索学科与人工智能交叉领域的学生开放。学校将设置基座模块课程,帮助学生理解 AI