Agent Browser Protocol — 为 AI Agent 重造浏览器,每步骤原子化同步执行
0 次浏览
2026/3/11
为什么 AI Agent 操控浏览器总出问题?
因为浏览器是异步的,Agent 是同步的。Playwright/Puppeteer 方案里,Agent 永远在和一个活生生的浏览器赛跑——等页面加载、等 JS 执行、猜什么时候 OK。Agent Browser Protocol(ABP)从根本上解决这个问题:魔改 Chromium,在浏览器进程内嵌入 HTTP 服务器,把浏览暂停成一个个原子步骤。
工作原理
- REST 优先:一个 HTTP 请求 = 一个完成的步骤,返回稳定状态 + 前后截图 + 事件日志
- 虚拟时间控制:暂停 JavaScript 和虚拟时间,Actions 之间浏览器不再自己乱动
- 引擎级集成:直接访问 Browser、TabStripModel、DevTools Agent 等核心 C++ 组件
- 确定性边界:文件选择框、对话框、下载作为事件暴露,无需轮询
- SQLite 会话录制:每个 Action 自动存档截图和元数据,可用于 VLM 训练数据
性能
Online Mind2Web 基准 90.53% 准确率,每个 Action 约 100ms 额外开销。支持 Claude Code、OpenCode 及任何 MCP 兼容客户端。Rust/C++ 实现。
免责声明
本站内容主要用于信息整理、技术研究与经验分享,不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。
- 本站所分享的资源、工具、教程等内容仅供学习与研究参考,请勿用于商业用途。
- 部分内容可能来源于公开网络或开源社区,如涉及版权或其他合法权益问题,请通过联系方式与我们联系,我们将在核实后及时处理。
- 如需将相关内容用于商业产品或盈利性业务,请自行联系权利方获取正式授权。
- 因不当使用引发的版权或合规风险,由使用者自行承担。
- 外部链接失效或无法访问属于正常现象,本站不保证所有链接的持续有效性。
转载或引用本文内容,请保留原文链接并注明来源。
评论
加载中...