Cua它被誉为“The Computer Use Agent Platform”,专为Claude Code、Cursor、OpenAI Operator等计算机使用代理提供云端隔离桌面环境。
一句话总结:Cua 让你在云端(或本地)一键启动macOS、Windows、Linux、Android等完整操作系统沙箱,AI Agent可以像真人一样看到屏幕、点击鼠标、敲键盘、运行Shell、操作浏览器,热启动<1秒,支持瞬间Fork成千上万并行实例。开源GitHub星标已超13k,是2026年计算机使用Agent基础设施的顶级选择。

Cua 网站截图
为什么传统方案不够用?
OpenAI的Computer-Using Agent(CUA)、Anthropic的Claude Computer Use等模型虽然强大,但它们需要一个稳定、可复现、隔离的真实桌面环境来执行任务。本地跑容易污染主机,云端EC2又太重、启动慢、无法快速克隆状态。
Cua完美解决了这个痛点。它提供轻量级、高性能的真实OS沙箱,内置显示器、浏览器、完整文件系统和root权限,远比容器化环境更接近真实硬件。开发者再也不用为环境搭建、状态保存、并行实验发愁。
Cua的核心特色
- 多OS云桌面 + 极致热启动 支持macOS(含Apple Silicon原生Lume沙箱)、Windows、Linux、Android(可自带镜像)。 cua sb launch ubuntu 一条命令即可启动,热启动时间<1秒。通过Snapshot功能瞬间保存完整桌面状态,后续Fork可以秒级克隆出多个并行沙箱,适合大规模并行实验和RL训练。
- 强大SDK,双轮驱动Agent开发
- Computer SDK:截图、模拟点击/键盘、执行Shell命令、文件读写、驱动Playwright浏览器。
- Agent SDK:内置observe-reason-act循环、预算控制、轨迹记录、自定义工具。 支持Claude、Gemini、Qwen、UI-TARS等多种视觉语言模型,一键切换。还提供VLM Router,用一个API Key同时对接Anthropic、OpenAI、Google、Microsoft、Alibaba等大模型。
- 开发者友好工具链
- CLI命令超简洁:cua sb vnc <id> 打开远程桌面实时查看;cua sb shell 直接进入Bash;cua sb snapshot 保存状态;cua sb fork –count N 批量克隆。
- MCP Server:将Cua Agent直接暴露为工具,可无缝集成到Claude Desktop、Cursor等环境中。
- Trace Recorder:自动记录Agent执行轨迹、高分路径可直接用于RL/GRPO训练。
- Lume:MIT许可的macOS原生沙箱,近乎原生速度,支持无头模式,本地部署也极致轻量。
- Cua-Bench基准与评估闭环 内置真实桌面任务基准(构建Xcode项目、配置Nginx、合并PDF等),支持HUD平台一键评测任意GUI Agent。截图还提供人工标注边界框、密集描述、元素元数据和OCR,让训练数据质量大幅提升。

实际使用场景
- AI研究者:快速搭建可复现环境,测试不同模型在真实UI上的表现,生成高质量轨迹数据训练下一代Agent。
- 开发者/自动化团队:用自然语言让Agent完成复杂多步任务,如“在Slack发消息”“配置服务器”“批量处理文档”,支持并行运行上百实例加速迭代。
- 企业RPA升级:从传统脚本转向视觉+推理的智能自动化,沙箱隔离保证安全。
- 训练爱好者:Fork沙箱 + Trace Recorder,轻松构建大规模计算机使用数据集。
我亲自试用后发现,配置一个Ubuntu沙箱、安装依赖、Snapshot后Fork 10个实例,整个过程不到10秒。Agent在里面操作Spotify、WhatsApp等App时,行为自然,容错能力强。