在使用 OpenClaw 进行浏览器自动化的过程中,我发现内置的浏览器控制存在两个主要问题:

  1. 会话持久化不佳:浏览器状态在命令之间经常丢失,需要重新导航和认证
  2. 性能表现欠佳:执行效率不够理想,影响自动化工作流的速度

解决方案

Chrome 浏览器本身就提供了官方的 DevTools Protocol ( CDP ),这是一个久经考验的浏览器控制协议。同时,社区已经有了优秀的 MCP 服务器实现( chrome-devtools-mcp ),可以将 CDP 与模型上下文协议( Model Context Protocol )桥接起来。

与其重新发明轮子,不如直接利用这些成熟的工具。

为什么选择 CLI ?

CLI 工具是 OpenClaw 生态系统中的一等公民。AI 助手可以可靠地调用 CLI 命令,解析输出,并将它们串联起来完成复杂的工作流。通过将 Chrome DevTools Protocol 封装为 CLI 接口,我们获得了:

持久化会话:浏览器在命令之间保持打开,维护状态、Cookie 和认证信息

更好的性能:直接 CDP 通信比其他浏览器控制方法更快

更高的可靠性:使用 Chrome 官方协议意味着更好的稳定性

灵活性:既可以独立使用,也可以通过 AI 助手使用

生态集成:无缝融入 OpenClaw 技能系统

主要功能

  • 浏览器导航和多标签页管理
  • 截图和 DOM 快照
  • 元素交互(点击、悬停、填充表单)
  • 网络请求监控
  • 控制台日志捕获
  • JavaScript 执行

项目地址: https://github.com/finas/browser-cli

欢迎试用并提供反馈!

标签: none

添加新评论