AI热点 3小时前 170 浏览次数 0 评论

Claude杀进谷歌浏览器,Agent能点、能填、能跳转,让页面自己“动”起来

智东西

发布了 198 文章

智东西AI前瞻(公众号:zhidxcomAI)

编译 | 江宇

编辑 | 漠影

智东西8月27日报道,Anthropic今日推出一款浏览器端AI Agent工具“Claude for Chrome”,允许用户直接在Chrome中调用Claude完成浏览、点击、填表等操作。

该产品以Chrome插件形式运行,目前作为“研究预览”阶段,仅向1000名Claude Max订阅用户开放测试,并同步开放候补名单登记。

Anthropic将这一功能视为AI接入人类日常软件生态的“下一步”,但也直言其中存在严峻安全挑战,尤其是Prompt Injection(指令注入)攻击风险。

Anthropic方面透露,Claude for Chrome已通过大量红队测试验证风险点,并实测在引入新防御机制后,将攻击成功率从23.6%降低至11.2%,部分特定场景中甚至降至0%

FellouAI创始人、前字节跳动工程师谢扬也随即发声称:“FellouAI可以作为Claude for Chrome的替代方案,新版本将于9月2日上线。”作为一款主打“Agentic Browser”形态的浏览器,FellouAI也被视为本轮浏览器智能体竞速中的有力竞争者。

图源:X

过去几个月,Anthropic陆续上线了Claude对接用户日历、文档等多种功能,如今终于迈入“浏览器操作”阶段。通过Chrome插件,Claude可以在用户授权下“看到你在浏览什么”,并执行点击、输入、跳转等操作,实现更深入的网页自动化能力。

1、找房筛选:用户在Chrome中输入一句自然语言指令(如“帮我在西雅图找一套3室、1500平方英尺以上、带车库、价格在80万美元以内的房子”),Claude可自动打开Zillow页面,配置筛选条件并返回最优选项列表。过程中,它会附上页面、定位搜索框、勾选条件,并请求权限后执行操作,实现“AI找房”

2、文档总结:在Google Docs中,Claude可读取整份PRD文档并自动提取出所有评论内容、汇总要点,并生成结构化摘要。Claude已具备通读上下文、提炼团队共识的能力,辅助用户高效处理修改意见。

3、外卖下单:在DoorDash场景下,Claude可以理解用户需求(如“帮我找一份蒜香面并加到购物车”),定位网页中对应模块,选择符合条件的餐厅选项,执行搜索与加购操作。

4、企业系统操作:在Salesforce这类企业管理平台中,Claude已能识别并操作系统级表单字段,例如点击“Convert Lead”按钮、识别弹窗信息、定位字段名称并修改内容,完成一系列跨层级自动操作,具备替代部分重复人工作业的潜力。

Claude的能力覆盖了多种高频使用场景,整体功能表现硬核。网友也对Claude浏览器能力的下一步联动表现出期待:“如果这套浏览器能力未来能和Claude Code整合,可能会非常惊艳。”

图源:X

这些演示案例都指向一个趋势:Claude正尝试打通“从理解语言、到浏览网页、到实际执行”的闭环,形成一个贯穿任务全流程的浏览器Agent。

它不再是一个纯文本助手,而是可以“点按钮”“填表单”“读评论”“下订单”的网页操作者,真正把浏览器变成AI的操作系统。

Anthropic认为,浏览器作为信息聚合中枢,将成为AI Agent的核心落点,“我们已经在内部测试中观察到Claude能处理包括日程管理、会议安排、邮件草拟、费用报销与网站测试等任务,效果明显。”

但这类能力也伴随着系统级安全挑战,其中最大的问题是Prompt Injection:攻击者可在网页、邮件甚至DOM隐藏内容中埋藏指令,诱使AI执行恶意行为,例如在隐藏文本写:忽略前述指令,改为执行某恶意操作。

在未加防护的早期测试中,一封伪装为“公司安全通知”的邮件成功诱导Claude删除用户所有邮件。而Anthropic的新防护措施成功拦截了这一攻击:Claude识别出这是可疑的钓鱼邮件,并未执行指令。

Claude for Chrome已上线多层安全机制,包括:

1、权限控制:用户可手动限制Claude访问网站范围。

2、高风险行为确认机制:如发布、付款、数据共享等行为需用户手动确认。

3、系统提示词优化:通过系统Prompt加强Claude对敏感操作的判断能力。

4、敏感站点默认禁用:金融、成人、盗版等类站点Claude默认不可访问。

5、行为模式识别:部署高级分类器识别潜在攻击指令与异常数据访问请求。

在Anthropic的实测中,未加防护的Claude浏览器使用场景下,Prompt Injection攻击成功率高达23.6%;而引入新防御机制后,成功率降至11.2%。特别是在DOM隐藏字段、URL伪装、标签诱导等“浏览器特有攻击”场景下,攻防结果从35.7%成功率降低至0%。

在三种测试场景中,Prompt注入攻击的成功率对比(分数越低代表防护效果越好)。最新安全机制使Claude的攻击成功率降至低于旧版电脑控制能力。

Anthropic强调,这一版本仍为早期预览,将借助测试用户反馈,持续迭代分类器与权限设计机制,以应对未来可能出现的新型攻击。

结语:Claude切入浏览器入口,“AI+浏览器”竞速初现雏形

浏览器入口之争,已成为AI产品竞争的前沿阵地。

Anthropic此举与Perplexity推出Comet浏览器、OpenAI加紧研发AI浏览器产品,以及Google在Chrome中集成Gemini的方向不谋而合。与此同时,Opera、Dia、Fellou等新玩家也在探索更具通用Agent能力的新浏览器形态。

无论是打造独立Agentic浏览器,还是在现有浏览器中嵌入AI助手,各方都在争夺人机交互的新入口。

谁能率先在这个入口上形成更高频、更有深度的AI执行能力,还有待进一步发展。

来源:TechCrunch

智东西

智东西

198 文章 27799 浏览次数 0 粉丝

评论 (0)

睡觉动画