首页/Agent Browser Protocol — 为 AI Agent 重造浏览器,每步骤原子化同步执行

Agent Browser Protocol — 为 AI Agent 重造浏览器,每步骤原子化同步执行

0 次浏览
2026/3/11

为什么 AI Agent 操控浏览器总出问题?

因为浏览器是异步的,Agent 是同步的。Playwright/Puppeteer 方案里,Agent 永远在和一个活生生的浏览器赛跑——等页面加载、等 JS 执行、猜什么时候 OK。Agent Browser Protocol(ABP)从根本上解决这个问题:魔改 Chromium,在浏览器进程内嵌入 HTTP 服务器,把浏览暂停成一个个原子步骤。

工作原理

  • REST 优先:一个 HTTP 请求 = 一个完成的步骤,返回稳定状态 + 前后截图 + 事件日志
  • 虚拟时间控制:暂停 JavaScript 和虚拟时间,Actions 之间浏览器不再自己乱动
  • 引擎级集成:直接访问 Browser、TabStripModel、DevTools Agent 等核心 C++ 组件
  • 确定性边界:文件选择框、对话框、下载作为事件暴露,无需轮询
  • SQLite 会话录制:每个 Action 自动存档截图和元数据,可用于 VLM 训练数据

性能

Online Mind2Web 基准 90.53% 准确率,每个 Action 约 100ms 额外开销。支持 Claude Code、OpenCode 及任何 MCP 兼容客户端。Rust/C++ 实现。

免责声明

本站内容主要用于信息整理、技术研究与经验分享,不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。

  • 本站所分享的资源、工具、教程等内容仅供学习与研究参考,请勿用于商业用途。
  • 部分内容可能来源于公开网络或开源社区,如涉及版权或其他合法权益问题,请通过联系方式与我们联系,我们将在核实后及时处理。
  • 如需将相关内容用于商业产品或盈利性业务,请自行联系权利方获取正式授权。
  • 因不当使用引发的版权或合规风险,由使用者自行承担。
  • 外部链接失效或无法访问属于正常现象,本站不保证所有链接的持续有效性。

转载或引用本文内容,请保留原文链接并注明来源。

评论

加载中...