首页/Browser Use — 让 AI Agent 像人一样操控浏览器(82.8k ⭐)

Browser Use — 让 AI Agent 像人一样操控浏览器(82.8k ⭐)

0 次浏览
2026/3/23

Browser Use 是什么?

Browser Use 是目前 GitHub 最受欢迎的 AI 浏览器自动化框架,已获 82,000+ 星。它让 GPT-4、Claude、Gemini 等任意 LLM 能够真正"看懂"网页并执行操作——不是传统的 CSS 选择器自动化,而是像人类一样理解页面上下文、做出决策并完成任务。

核心特性

  • 多模态感知:截图 + DOM 双通道理解页面,准确率远超纯文本方案
  • 极简 API:5 行 Python 代码即可让 AI 完成复杂网页任务
  • 多 LLM 支持:OpenAI、Anthropic、Google、Ollama 本地模型均可对接
  • 任务持久化:长任务支持断点续跑,中断后可从上次位置继续

快速上手

from browser_use import Agent
from langchain_openai import ChatOpenAI

agent = Agent(
    task="在京东搜索 iPhone 16 并找到最低价",
    llm=ChatOpenAI(model="gpt-4o"),
)
await agent.run()

典型使用场景

  • 电商比价和自动下单
  • 社交媒体内容自动发布
  • 表单批量填写
  • 网页数据采集(无需写爬虫)
  • 软件测试自动化

与 Selenium/Playwright 对比

传统工具需要手写选择器维护,UI 变动就要重写脚本。Browser Use 用 AI 理解意图,UI 变了也能自适应,维护成本极低。

项目地址:https://github.com/browser-use/browser-use

免责声明

本站内容主要用于信息整理、技术研究与经验分享,不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。

  • 本站所分享的资源、工具、教程等内容仅供学习与研究参考,请勿用于商业用途。
  • 部分内容可能来源于公开网络或开源社区,如涉及版权或其他合法权益问题,请通过联系方式与我们联系,我们将在核实后及时处理。
  • 如需将相关内容用于商业产品或盈利性业务,请自行联系权利方获取正式授权。
  • 因不当使用引发的版权或合规风险,由使用者自行承担。
  • 外部链接失效或无法访问属于正常现象,本站不保证所有链接的持续有效性。

转载或引用本文内容,请保留原文链接并注明来源。

评论

加载中...