Cloudflare 在其 Agents Week 活动中宣布,Sandboxes 和 Cloudflare Containers 正式上线,为 AI 代理工作负载提供隔离的持久化 Linux 环境。

该服务于去年 6 月首次推出测试版,此次正式版发布新增了安全凭证注入、PTY 终端支持、持久化代码解释器、文件系统监听、基于快照的会话恢复,以及按实际使用周期计费的 Active CPU 定价机制。来自 Cloudflare 团队的 Kate Reznykova 和 Mike Nomitch 写道

我们如今拥有的东西已经截然不同。如今的沙箱是一个完整的开发环境:有可连接浏览器的终端、有具有持久状态的代码解释器、有带实时预览 URL 的后台进程、有能实时触发变更事件的文件系统、有用于安全凭证注入的出站代理,以及能实现近乎即时热启动的快照机制。

Cloudflare Sandbox 是一个容器,当通过名称进行请求时,它会按需启动,当处于空闲状态时,它会自动休眠,并在接收到新请求时重新激活。同一个沙盒可以通过一个统一的标识符从任何地方进行访问,为代理提供一个在各种交互中都能持续存在的有状态环境。该 SDK 提供了执行命令、克隆存储库、写入文件以及通过 TypeScript API 管理进程等方法。

自测试版发布以来,主要改进集中在安全性、开发体验和成本方面。在安全性方面,出站 Workers 提供了一个可编程的出站代理,可以拦截来自沙箱的出站请求,并在网络层注入凭证。代理永远不会看到令牌。开发者可以针对每个目标域名编写自定义的身份验证逻辑,针对每个沙箱应用基于身份的策略,并在任务进行过程中动态限制网络访问。Cloudflare 将此描述为一种零信任模型,即绝不向不受信任的工作负载授予任何令牌。

class OpenCodeInABox extends Sandbox{  static outboundByHost = {    "my-internal-vcs.dev": (request, env, ctx) => {      const headersWithAuth = new Headers(request.headers);      headersWithAuth.set("x-auth-token", env.SECRET);      return fetch(request, { headers: headersWithAuth });    }  }}
复制代码

在开发体验方面,PTY 支持取代了早期代理系统中基于请求-响应的 shell 模拟机制,转而利用 WebSocket 代理提供的真实的伪终端会话。持久化代码解释器可以在不同的执行调用之间保持状态,因此变量和导入内容能在各个步骤之间得以保留,就像在 Jupyter 笔记本中一样。具备实时预览 URL 的后台进程使代理能够启动开发服务器并分享可工作的链接。基于 Linux inotify 构建的文件系统监听功能,允许代理实时响应文件变更。

快照功能将于未来几周内推出,它可以保存容器的完整磁盘状态,并支持近乎即时的恢复。这使得代理能够实现会话分叉:从同一快照启动四个沙箱,并行探索不同的方案。Cloudflare 通过具体数据展示了这一功能的实际效果:克隆仓库、运行 npm install 并从头开始启动需要 30 秒,而从备份中恢复仅需 2 秒。

Figma 正在该基础设施上运行生产级代理工作负载。Figma AI 与开发平台负责人 Alex Mullans 在公告中描述了这一用例:

Figma Make 的设计初衷是帮助来自各行各业的开发者和创作者更快地将创意转化为成品。为了实现这一目标,我们需要一种基础设施解决方案,能够提供可靠且高度可扩展的沙箱环境,以便在其中运行不受信任的代理和用户编写的代码。

AI 代理沙箱领域的竞争变得越来越激烈。E2B 采用为每个会话配备专用内核的 Firecracker microVM,据称约半数财富 500 强企业都已经采用该方案。Daytona 于 2025 年初从开发环境转型为 AI 代理基础设施。按照该公司的说法,使用 Docker 容器时沙箱创建可以在 90 毫秒以内完成。Modal 则致力于通过无服务器基础设施处理对 GPU 需求较高的 Python 工作负载。Vercel 推出了基于 Firecracker 的自有沙箱测试版。Cloudflare 服务的独特之处在于其全球网络的边缘分发能力,以及两层架构:用于临时代码执行的轻量级 V8 隔离环境 Dynamic Workers(该功能在同期的 Agents Week 活动中进入公开测试阶段),以及当代理需要包含 Git、Bash、开发服务器和多语言构建功能的完整操作系统时所使用的全容器化沙箱。

在定价方面,Sandboxes 现在已经采用按实际 CPU 使用量计费的模式,仅对实际使用的 CPU 周期收费,而不是按照预先分配的资源收费。CPU 时间按每 vCPU-秒 0.00002 美元计费。标准套餐最多支持 15000 个并发轻量级实例、6000 个基础实例以及 1000 多个大型实例。SDK 版本为 0.8.9,相关文档已经发布。

声明:本文为 InfoQ 翻译,未经许可禁止转载。

原文链接:https://www.infoq.com/news/2026/04/cloudflare-sandboxes-ga/

标签: none

添加新评论