Midjourney操作界面

​OpenAI 发布“智能体构建实战指南”实用性文档(附文档资源)

4.8
0热度

人工智能领域领军企业 OpenAI 近日重磅发布了一份名为“构建智能体实践指南”("A practical guide to building agents")的实用性文档。这份共34页的指南旨在为产品和工程团队提供构建首个智能体系统的必要知识和最佳实践,其内容凝结了 OpenAI 从众多客户实际部署案例中获得的深刻洞察。通过阅读本指南,开发者将能够理解智能体的核心概念,掌握何时以及如何设计、构建

人工智能领域领军企业 OpenAI 近日重磅发布了一份名为“构建智能体实践指南”("A practical guide to building agents")的实用性文档。这份共34页的指南旨在为产品和工程团队提供构建首个智能体系统的必要知识和最佳实践,其内容凝结了 OpenAI 从众多客户实际部署案例中获得的深刻洞察。

通过阅读本指南,开发者将能够理解智能体的核心概念,掌握何时以及如何设计、构建和安全部署智能体。

QQ_1744946969203.png

什么是智能体?

指南首先对智能体进行了清晰的定义,强调其与传统软件在自动化工作流程方式上的根本区别。传统软件旨在简化和自动化用户发起的工作流程,而智能体则能够高度自主地代表用户完成整个工作流程。一个工作流程被定义为实现用户目标所需执行的一系列步骤,例如解决客户服务问题、预订餐厅、提交代码变更或生成报告. 然而,仅仅集成大型语言模型(LLM)的应用程序,如果不能利用 LLM 来控制工作流程的执行,例如简单的聊天机器人或情感分类器,则不能被称为智能体。真正的智能体具备核心特征,使其能够可靠且一致地代表用户行动,这包括利用 LLM 管理工作流程的执行和做出决策,并在必要时主动纠正自身行为,甚至在失败时中止执行并将控制权交还给用户。此外,智能体还能访问各种工具与外部系统进行交互,动态选择合适的工具,并在明确定义的安全护栏内运行.

何时应该构建智能体?

指南指出,构建智能体需要重新思考系统如何进行决策和处理复杂性。与传统的确定性和基于规则的方法不同,智能体特别适用于那些传统方法难以奏效的工作流程。指南通过支付欺诈分析的例子进行了生动的对比:传统的规则引擎如同一个清单,根据预设的标准标记交易;而 LLM 智能体则更像一位经验丰富的调查员,能够评估上下文、考虑细微的模式,即使在没有明确规则的情况下也能识别可疑活动。因此,在评估智能体的价值时,应优先考虑那些过去难以自动化的工作流程,尤其是在以下三种场景中:

  • 复杂的决策: 涉及细致的判断、异常情况或上下文相关的决策的工作流程,例如客户服务中的退款审批。
  • 难以维护的规则: 由于庞大且复杂的规则集而变得难以维护的系统,使得更新成本高昂或容易出错,例如执行供应商安全审查。
  • 严重依赖非结构化数据: 涉及解释自然语言、从文档中提取意义或以对话方式与用户交互的场景,例如处理房屋保险索赔。

指南强调,在决定构建智能体之前,务必验证用例是否明确符合这些标准,否则,确定性的解决方案可能就足够了。

智能体设计基础

指南详细介绍了构建智能体的三个核心组成部分:

  • 模型(LLM): 驱动智能体的推理和决策。指南建议在原型阶段使用性能最强的模型建立基准,然后尝试使用较小的模型以优化成本和延迟。
  • 工具: 智能体可以用来执行操作的外部函数或 API。工具通过底层应用程序或系统的 API 扩展了智能体的能力。对于没有 API 的遗留系统,智能体可以依赖计算机使用模型通过 Web 和应用程序 UI 直接交互。指南将工具大致分为三类:数据检索(例如查询数据库、读取 PDF 文件或搜索网络)、执行操作(例如发送电子邮件、更新 CRM 记录)和 编排(智能体本身可以作为其他智能体的工具)。
  • 指令: 定义智能体行为的明确指南和安全护栏。高质量的指令对于智能体至关重要,能够减少歧义并提高决策质量。指南提供了利用现有文档、将任务分解为更小的步骤、定义清晰的行动以及捕获边缘案例等最佳实践。

指南还简要介绍了编排的概念,即将基础组件组合起来以有效地执行工作流程。编排模式主要分为单智能体系统(单个智能体配备工具和指令在一个循环中执行工作流程)和多智能体系统(工作流程的执行分布在多个协调的智能体之间)。多智能体系统又可以分为管理模式(一个中央“管理”智能体通过工具调用协调多个专业智能体)和去中心化模式(多个智能体作为对等方运行,根据其专业领域相互移交任务).

安全护栏

指南特别强调了安全护栏对于管理数据隐私风险和声誉风险的关键性。开发者应该针对已识别的风险设置护栏,并随着新漏洞的发现增加额外的护栏。安全护栏应与强大的身份验证和授权协议、严格的访问控制以及标准的软件安全措施相结合,形成一个多层防御机制。指南列举了多种类型的安全护栏,包括相关性分类器(确保响应在预期范围内)、安全分类器(检测不安全的输入)、PII 过滤器(防止暴露个人身份信息)、审核(记录智能体的行为)、工具安全措施(评估和控制工具的风险)、基于规则的保护(例如黑名单、输入长度限制)和输出验证(确保响应符合品牌价值)。指南还介绍了在 Agents SDK 中设置安全护栏的方法,并强调了人为干预作为关键保障的重要性,尤其是在早期部署阶段,以识别故障和边缘案例.

总结和资源链接

指南最后总结指出,智能体标志着工作流程自动化领域的新时代,它们能够推理模糊性、跨工具执行操作以及处理多步骤任务,具有高度的自主性。构建可靠的智能体的关键在于强大的基础(模型、工具和指令)、适当的编排模式以及关键的安全护栏。指南鼓励用户从小处着手,通过与真实用户的验证逐步扩展智能体的能力。最后,指南提供了 OpenAI API 平台、OpenAI for Business、开发者文档等更多资源的链接.

OpenAI 的这份“构建智能体实践指南”为希望探索和构建智能体系统的团队提供了全面的指导和实用的建议,预示着各行业将加速迈向更加智能和自动化的未来。

文档资源链接:https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf

点赞(0)

评论列表 共有 0 条评论

暂无评论
发表
评论
顶部