AI热点 5小时前 169 浏览次数 0 评论

深度|Agent 全球爆发,Agent Infra是否是搭上这趟快车的关键?

AI中国
AI中国

发布了 9148 文章


图片来源:Unsplash


01 AI Agent 引爆元年:从开源Agent框架到未来企业新势力


京东云于今年 7 月正式开源了JoyAgent‑JDGenie,这是业内首个“完整产品级”通用多智能体系统——覆盖前端/后端/智能体框架/执行引擎以及众多子 Agent(如报告、代码、PPT 智能体);在权威 GAIA 基准测试中取得 75.15% 整体准确率,,显著超越 OWL、OpenManus 等同类开源产品。真正实现了Agent开发的“开箱即用”


在这之前,黑马公司 Flowith 发布了其革命性 Agent 产品 Neo,号称世界首款支持“三无限”的智能体:无限步骤:可持续运行复杂任务秒拆解、精准执行(如定时生成报告、持续爬取信息等);无限上下文:支持百万 token 的任务历史记忆,能处理上万字对话与内容生成;无限工具:可并行调用多个工具,从搜索引擎、代码执行器到图像生成器,协同工作生成最终结果


KPMG也于今年6月发布了 Workbench多Agent 平台,初期就已部署 50 个智能体,并预计扩展到近千个,广泛服务于税务、审计、咨询等领域。我们见证着 AI Agent 逐渐成为智能化运营的基础构件,而非科研实验室的边缘项目。


论是 Flowith 的无限执行力、Manus 的通用拆解能力,KPMG 的企业级落地,还是如 OpenAI、Google、字节跳动、智谱、MiniMax等模型厂商也纷纷入局Agent,均指向一个趋势:AI Agent 正从单一对话工具,迈向能够主动执行任务、联动服务、实时反馈的“数字生产力”时代。


AI Agent 落地面临的四大核心痛点


尽管 Agent 应用正迅速崛起,要实现实际落地仍面临许多关键挑战:


1. 稳定性与执行链路断裂


真实业务环境中,Agent 容易因为算力资源波动、调用延迟、外部数据获取超时而出现“掉链子”现象,造成用户体验的“用几次就废”。同时缺乏高可用云节点、弹性算力调度与边缘加速,会放大这些不稳定性,导致长任务执行中断或输出不连贯。


2. 数据质量差与接入复杂


内部文档与业务数据分散在不同系统,存在多版本、冗余、缺乏标准化的问题;实时网络数据更新无法及时同步,导致模型使用过期或错误信息。再加上没有统一的数据接入与清洗机制,检索精度和推理可信度都大打折扣。


3. 模型管理分散、推理性能难优化


Agent 通常需要调用多种大模型(通用、垂直、专用微调),但缺乏统一接入与管理平台。模型版本切换慢、策略路由缺失、推理延迟高,都会影响业务实时响应能力,也增加了调优与迭代成本。


4. 调试、监控与合规部署困难


跨云、跨系统的 Agent 缺乏全链路可观测性与审计能力,问题难以复现。金融、医疗、政企等场景下,数据与推理过程无法在合规框架内运行,更增加了部署阻力与安全风险。


这些交织的痛点都指向一个核心问题:想让 Agent 能在真实业务中稳定落地,需要一套专为它设计的基础设施:Agent Infra。这个基础设施不仅要提供稳健的执行环境,还需能高效管理模型、支撑多样工具调用,以及保证数据的精准供给和安全合规。


真正的 Agent Infra 应具备以下关键能力:


  • 弹性与容灾的运行环境(Environment)


  • 模型入口与路由的可控体系(Tools/Model Layer)


  • 高质量、低延迟的数据供给与检索(Context/Data Layer)


  • 安全审计与多 Agent 协同能力(Security & Orchestration)


满足这些基础设施要求,看似统一,但实现难度巨大。这正是市场上大多数 Agent 项目卡在 PoC 阶段、无法规模化落地的关键。


目前,针对此类痛点,业界已经有公司交出了令人满意的答卷。 小宿科技从创立初期就深耕AI基础设施行业,目前已经服务了全球近千家客户,覆盖了国内超过一半的头部原生应用,并成为全球 Agent Infra 领域的佼佼者。


为何小宿科技能在如此短的时间内抓住机遇获得巨大的成功?或许我们可以从其旗下产品的分布了解一二:


  • IaaS(AI云服务):小宿AI云,AI云全栈服务平台。提供全球化云与算力资源,支持私有化/混合云部署、弹性 GPU 调度、边缘节点加速、Agent 沙盒,以及全链路监控与容灾能力,为 Agent 执行链路提供稳定的“地基”。


  • MaaS(模型服务):小宿模型聚合平台,一站式模型聚合管理平台。实现统一模型接入与版本管理,通过策略化路由、A/B 分流、回退机制与推理监控,保障推理过程的稳定性与迭代速度。


  • DaaS(数据服务):小宿智能搜索,专为Agent设计的智能搜索与数据服务。多源实时接入、结构化与多模态检索、去重与版本管理、证据溯源,以及低延迟查询,确保 Agent 持续、准确、实时地获取信息。



小宿科技这三层 Infra 产品构建了面向 AI Agent时代的全链路技术底座:IaaS 层提供全球化、高性能、合规可控的云、算力及Agent沙盒服务,MaaS+DaaS层通过“智能搜索 + 模型聚合”赋能 Agent 的信息获取与推理能力,打通了“可靠的运行环境 + 可控的模型治理 + 高质量的实时数据”的 Agent 运行逻辑,并解决了“感知 → 收集 → 推理 → 反馈”各环节的关键痛点,真正实现了为AI智能体而设计的 Agent Infra。


02 为什么 AI Agent 的真正竞争,将落在“联网检索 + 实时数据接入”能力上


随着 AI Agent技术的快速发展,我们正在见证一个全新的趋势——AI Agent 不再满足于简单的“会说话”,而是积极向“能行动、能决策”转型。当一个 Agent 要制定策略、给出建议、完成操作时,它必须能够随时检索获取最新信息,最终成为行动链中的关键一环。


所以,在蓬勃发展的的AI Agent应用背后,智能搜索已经成为了一种刚需。


补充知识盲区,用最新数据支撑判断


LLM 知识滞后:模型训练过程中只能使用一定历史内容(如半年甚至更早),无法获取当天政策、新闻、法规或市场动态。Agent 如要生成执行式建议或完整报告,必须接入最新信息,否则输出只能停留在“旧时代的结论”。


深度检索:通过联网搜索,模型能力逐步走向任务驱动型的“查找 → 学习调研 → 内容生成/知识综合/结构化输出”闭环流程。例如,OpenAI 的 ChatGPT Deep Research 与 Anthropic 的 Claude Research 均已将网页搜索能力内嵌于模型系统中,通过自动搜、自动聚合,再结合 LLM 生成报告级输出,为用户提供可信、实时、可复用的信息基础



面向用户:RAG让知识检索更“聪明”


Retrieval-Augmented Generation 是检索增强生成流程:Agent 会先检索信息(如网页、文档、数据库),将结果反馈给 LLM,后者据此生成更准确、专业的回答。


当 Agent 接到一个宏观任务(比如“计划巴黎度假行程”)时,它会通过任务识别、拆分和多轮执行进入一个精细的多级任务流程:


Macrotask(宏任务):计划巴黎度假行程


Subtask(子任务):订去巴黎的机票 → 比较可选择的机票 → 订下最合适的机票


Subtask:安排住宿 → 比较可选择的酒店 → 订下最合适的酒店


图示中展示出传统搜索只能覆盖“Find”(查找)阶段,而结合联网智能体的能力,可进入上述等更深层次的任务


为了支持这种层级任务执行,Agent 必须接入多种数据源协同检索能力:网页搜索:检索实时航班或酒店报价;知识库 / 企业数据库:查询机票政策或酒店评价审核流程;向量检索引擎:针对历史用户偏好或文本内容提供语义匹配建议


借助一体化检索平台,智能 Agent 即能自动识别任务层级、分解子任务、并依据不同来源提供检索结果支持,从而避免信息偏差与上下文断裂。


面向企业:为什么 B2B Agent 离不开AI搜索?


从金融、通信、制造、保险资管到医疗等多个行业,越来越多企业正积极搭建并运营自己的内部 AI Agent,以实现客服自动化、市场洞察、财务分析、研发支持等一系列业务协同与效率提升。在这些企业级 Agent 实际运作过程中,为了保持智能体具备 实时性、高效性和准确决策能力,离不开外部联网数据的持续获取与动态更新。



03 小宿智能搜索,全方面赋能AI Agent的数据获取


2025 年,Agent 与搜索的深度融合已成必然。作为全球领先的AI Agent基础设施服务商,小宿科技旗下智能搜索服务已携手 Lemon AI、魔搭 MCP 广场、Coze平台、MCP.so等开源与企业级 Agent 平台,为开发者和产品团队提供一站式的AI Agent基础设施解决方案。无论是自主推理、自动执行任务,还是实时浏览网页数据,小宿智能搜索都能以高时效、高准确、高结构化的检索能力,成为背后最强大的信息推手。目前,小宿科技AI Agent基础设施服务——智能搜索,模型聚合,全栈 AI 云——已合作海内外近千家企业,搜索服务月调用量更是达数亿次。能被客户信任并选择,离不开小宿智能搜索杰出的数据能力,以及专精 Agent 开发痛点的市场定位。



全球化数据覆盖 + 合规保障,多语种无死角


小宿智能搜索原生支持包括中文、英文、西班牙语、葡萄牙语在内的 35+ 主流语种,为跨国场景提供统一的查询体验。无论 Agent 面对哪种语言的内容,都能获得本地化、符合法规要求的数据服务,帮助企业与开发者轻松应对 GDPR、CCPA 等多国监管标准。



多模态搜索,一站式满足 Agent 的多样数据需求


小宿智能搜索不仅支持纯文本检索,还集成了“文搜图”“图搜文”“图搜图”“视频检索”功能。Agent 可以用一句自然语言输入召回相关图文并茂的结果,也可上传图片反查相似场景,甚至精准定位视频片段——所有检索模式在同一 API 下无缝切换,让多模态 Agent 在知识获取时更具灵活性与深度。



长摘要总结,关键信息一览无余


小宿智能搜索打破传统“摘要式”检索的限制,直接获取网页、PDF、报告等内容的完整正文,并支持以 Markdown 等格式输出,自动高亮与查询意图最相关的关键词与段落。无论是数十页的行业白皮书,还是纷繁复杂的法规条款,Agent 都能在一行调用中获取全量信息,而不是向用户答复“如需获取更多信息,请点击相关链接”。



智能召回 + 精准排序,内容质量远超主流搜索引擎


依托自研的千亿级向量语义索引和多阶段排序模型,小宿智能搜索能根据 Agent 的查询意图,精准召回最相关内容,并通过语义打分与可读性评估,提供更契合任务需求的结果。在Search Arena的客观评测中,使用 DeepSeekR1 对 SmartSearch 与 某海外主流搜索引擎SearchAPI搜索结果进行逐项评分,涵盖“有用性、相关性、深度、引用、推理与准确性”等维度,结果显示:小宿智能搜索在 44% 的查询中被评判为优于友商(友商 为 41%,还有 15% 被评为一致表现)。这充分体现了小宿智能搜索在理解查询意图、提供多维深入内容与保障表达准确清晰度方面的优势。



高可用 + 低延迟,Agent 系统稳定可靠


小宿智能搜索提供秒级响应,SLA 达 99.9%。灵活部署与智能路由容灾机制可在节点故障时秒级切换,保障 Agent 在并发高峰或跨地域编排场景中的持续稳定运行,让智能体的运行永不停摆。



结语


支撑 Agent 从“会说话”到“会做事”,靠的不只是模型,还需要稳定的 Agent Infra——AI云(IaaS)、模型管理(MaaS)、数据服务(DaaS)缺一不可。


小宿科技正是用这三层全链路基座,让每一个 Agent 都能稳定运行、快速落地,如果你正在搭建 Agent 应用,不妨试试小宿科技,让它立刻在稳定坚实的基础上动起来。


文章来自于微信公众号“Z Potentials”。


AI中国

AI中国

9148 文章 1505232 浏览次数 950300 粉丝

评论 (0)

睡觉动画