AI热点 6 months ago 220 Views 11 Comments

微软开源Web Agent项目:Magentic-UI!

cnhcly
cnhcly

Published 11569 Articles

当全球开发者还在为Copilot的代码生成能力惊叹时,微软的AI实验室在Build 2025 开发者大会上又甩出一张开源王炸——Magentic-UI!这是继 Magentic-One 后,微软推出的新一代多智能体 Web 操作系统!

它可以:

自动浏览网页、 读取文件、 写代码,还能和你配合完成任务。

但它不是全自动机器人,它是你和 AI 一起工作的小伙伴,你有最终的控制权,它只负责干活。

  • 所有操作都显示给你看,点击按钮、打开页面、发送信息,都会提前征求你同意。
  • 执行任务时,你可以随时暂停、修改计划、重启流程。
  • 你也可以设置哪些操作必须人工批准。

一、主要功能:

  • 浏览网页自动点击、填表
  • 写代码、运行结果返回
  • 看文件内容并回答问题
  • 用户可以制定任务步骤,随时修改、暂停

二、核心亮点

协同规划:任务开始前,Magentic-UI 会生成详细的步骤计划,用户可以根据自己的需求和预期对计划进行调整和确认,保证任务按预期展开。

协作执行:在任务执行过程中,系统会实时显示即将执行的动作,用户可随时接管控制权,确保任务执行符合需求。

安全机制:在执行重要或不可逆的操作前,Magentic-UI 会征询用户同意,支持用户自定义审批规则,保护操作安全。有效避免了因 AI 决策失误而可能带来的损失,让用户在使用过程中更加安心。

学习复用:任务结束后,系统会保存执行方案,用户可以在未来的任务中重复使用或修改这些方案,从而提升工作效率。随着使用次数的增加,Magentic-UI 会越来越了解用户的工作习惯和需求,提供更加个性化和高效的服务。

三、技术创新

  • 神经样式引擎(NSE) 采用类GPT-4的扩散模型,可将自然语言描述(如"科技感深蓝渐变")动态编译为CSS变量,同时保证多浏览器兼容性。
  • 组件DNA图谱 每个组件都有可追踪的版本基因,支持跨项目的智能组件复用。某开源社区测试显示,组件重复开发率降低92%。
  • 实时性能先知 在拖拽布局时,AI会预测页面加载性能,并给出优化建议。早期采用者反馈,首屏加载时间平均减少40%。

当我们在惊叹Magentic-UI的神奇时,微软AI实验室负责人Chris Novak却说:"这仅仅是智能开发工具进化的第一个阶段。" 期待它将在未来的数字化生活和工作中发挥更大的作用,为我们带来更加高效、智能、安全的体验。

GitHub:https://github.com/microsoft/magentic-ui

cnhcly

cnhcly

11569 Articles 2144100 Views 950300 Fans

Comment (11)

User avatar

太棒了!微软开源Web Agent,创新升级!

User avatar

这下可真热闹,感觉Web Agent要成为新的信仰了

User avatar

微软终于醒悟了,这下可好笑了

User avatar

这下可真刺激,感觉世界要被Web Agent统治了

User avatar

这下可热闹了,人类的未来,掌握在开源手里了

User avatar

我支持!创新永远是进步的动力

User avatar

微软的脑洞还是值得一看的

User avatar

太有意思,感觉要来一场数字革命

User avatar

感觉未来Web浏览会彻底变样啊

User avatar

简直是给开源社区送了一份大礼!

睡觉动画