技术解读 5月前 • 162 浏览次数 • 0 评论

遍历 100 篇核心文献，北大这篇综述全景解析「代码智能体」技术演进

InfoQ

InfoQ

发布了 334 文章

近年来，基于大语言模型（LLM）的代码生成技术迅速发展，正逐步改变软件开发的实践方式。然而，尽管 LLM 在生成独立代码片段方面表现出色，其在处理复杂、工程化开发任务时仍存在显著局限——缺乏任务的自主分解能力、与真实开发环境的交互能力、对生成的代码进行验证以及持续的自我修正机制。

为解决这些问题，基于 LLM 的代码生成智能体（Code Generation Agent）被提出，其以 LLM 作为“大脑”，通过构建自主规划、行动、观察与迭代优化的能力，模拟人类程序员“分析需求、编写代码、运行测试、修复错误”的完整工作流，从而处理远超单个大语言模型能力范围的复杂编码任务。

当前，AI Agent 技术正迎来商业应用的关键阶段，成为 AI 驱动软件开发领域最受瞩目的方向之一。北京大学李戈教授团队近期发表的《基于大语言模型智能体的代码生成综述》，基于对 100 篇高质量核心文献的分析与总结，系统梳理了代码生成智能体的核心进展、关键技术和未来发展趋势，为该领域的学术研究与工程实践提供了兼具深度和广度的产研视角。

论文下载地址：https://arxiv.org/abs/2508.00083

论文通讯作者：北京大学计算机学院长聘教授、教育部长江学者李戈。

第一作者：董益宏，北京大学计算机学院 22 级博士生，曾在 ISSTA、FSE、ACL、NeurIPS、TOSEM 等 CCF-A 类/SCI 一区国际顶级会议和期刊上发表十余篇学术论文。

代码智能体和以往代码生成技术有何区别？

《综述》指出，AI 在软件开发中的角色，正从一个“辅助性的帮手”，进化为一个“能独立思考和行动的伙伴”。

代码生成智能体与之前的技术相比，展现出三大核心区别：

自主性：从被动补全到主动闭环：传统代码生成模型多以代码补全/函数生成等方式被动辅助开发；代码生成智能体则能像人类开发者一样，主动管理并执行从需求到实现的开发工作流。这使得开发者角色相应从“代码编写者”转为“任务定义者、过程监督者与成果审查者”。

任务范围的广泛性：从代码片段到软件开发全周期：以往研究聚焦于边界清晰的局部任务，如根据上下文补全代码行；代码智能体则扩展到处理模糊需求、项目级编码实现、测试与重构、基于实时反馈的迭代优化等，覆盖软件开发的大部分任务，更贴近真实软件工程场景。

工程实践性增强：从算法精度到系统工程：早期研究关注提升模型的算法精度；如今代码智能体重心显著转向工程可靠性、复杂工作流管理与高效工具编排等问题，研究边界由“模型生成”扩展至系统设计、过程管理与人机协同等更贴近经典软件工程的范畴。

单智能体和多智能体核心技术全景解析

具备上述特征的代码智能体在技术上是如何实现的呢？《综述》分为两大类进行叙述：单智能体代码生成方法和多智能体代码生成系统。

单智能体代码生成关键技术

单智能体如何处理复杂开发任务？其三大核心技术是：

规划与推理技术：“先规划，后实现”范式，在生成具体代码前，先输出高层次的求解步骤，有效分解复杂任务。

工具集成与检索增强：集成编译器、网络搜索、静态分析器等外部工具，或利用 RAG 技术从代码库中检索相关信息，扩展模型能力边界。

反思与自改进：模拟人类编程中“生成—评估—修改”的过程进行自主迭代优化，实现代码质量的持续提升。

相关的代表性研究工作和演进路径如下图：

多智能体代码生成关键技术

多智能体系统的核心在于设计高效的协作机制。例如：安排代码生成智能体系统中的工作流、实现智能体之间高效的信息交互与管理，以及通过协同优化将多个智能体转化为一个能力更强的整体系统，从而解决远比单个智能体所能处理的更大、更复杂的软件工程任务。

相关代表性研究如下图所示：

应用场景广泛，关键挑战也不容忽视

当前，代码生成智能体正深度渗透软件开发的全生命周期，在自动化代码生成与实现、自动化调试与程序修复、自动化测试代码生成、自动化代码重构与优化、自动化需求澄清等多个关键环节发挥作用，显著提升软件开发效率与质量。

多智能体代码生成工具已从技术概念走向产业落地，且清晰地呈现出“编程助手→协同伙伴→自主开发团队”的进阶演进趋势。

尽管应用前景广阔，但《综述》同样指出了当前代码智能体所面临的严峻挑战。

新一代软件开发范式——“人→智能体→结果”

基于大模型的代码生成智能体，其意义远不止于提升编码效率，它正深刻地变革软件开发范式。《综述》在最后展望了这一新兴领域未来的长期核心研究方向。

目前，我们仍处于“人+智能体→软件”的协作范式中。在此模式下，人类开发者保留核心主导地位，利用智能体加速编码、调试与维护等环节。

但未来，一个全新的“人→智能体→结果”范式正在演进而来。在这个新范式下，智能体系统本身成为了封装整个问题解决流程的“即时软件服务”。人类开发者的角色从软件的“构建者”，上升为最终结果的“提供者”，人只需在更高的抽象层次上描述意图，而智能体系统则会自主地完成从即时编码、执行到交付最终成果的全过程。

这无疑对智能体系统的自主性、可靠性和端到端任务完成能力提出了前所未有的要求。但正如文中所展望的：随着这些挑战的逐步攻克，代码生成智能体将从根本上重塑软件工程的面貌，将开发者从繁琐的编码工作中解放出来，更专注于创造性的问题定义与系统设计。

InfoQ

InfoQ

334 文章 48495 浏览次数 0 粉丝

评论 (0)

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

专为端侧大模型而生：解密AI计算加速“秘密武器”Arm China周易X3 NPU IP

专为端侧大模型而生：解密AI计算加速“秘密武器”Arm China周易X3 NPU IP

3月前 • 技术解读

中关村学院新发现：轻量级验证器可解锁LLM推理最优选择

中关村学院新发现：轻量级验证器可解锁LLM推理最优选择

4月前 • 技术解读

RLinf上新πRL：在线强化学习微调π0和π0.5

RLinf上新πRL：在线强化学习微调π0和π0.5

4月前 • 技术解读

信息设计二重奏

信息设计二重奏

4月前 • 技术解读

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • 技术解读

地址栏也能打游戏！程序员用不到400行代码，在浏览器地址栏复活《贪吃蛇》，网友惊叹：怎么想出这个点子的？

地址栏也能打游戏！程序员用不到400行代码，在浏览器地址栏复活《贪吃蛇》，网友惊叹：怎么想出这个点子的？

5月前 • 技术解读

产品能力，作为一种底层操作系统：解码梁宁思想中的“同理心”内核

产品能力，作为一种底层操作系统：解码梁宁思想中的“同理心”内核

5月前 • 技术解读

拼多多直通车断流解决方案

拼多多直通车断流解决方案

5月前 • 技术解读

热门标签

OpenAI企业版ChatGPT stablediffusion安装教程生数企鹅读伴微软Edge浏览器 AI智能代理后门植入可灵2.1 visionOS 英语口语

热门作者

AI中国

AI中国

11569 文章 95.03万关注

钛媒体APP

钛媒体APP

1489 文章 0 关注

IT之家

IT之家

1221 文章 5.64K 关注

人人都是产品经理

人人都是产品经理

1210 文章 5.87万关注

AIbase基地

AIbase基地

1093 文章 9.63万关注