Anthropic毫无预警地扔出了一颗足以重新定义AI能力边界的产品升级——Claude不再局限于对话框内的文本交互,而是真正长出了”手”和”眼”,能够像人类一样观察屏幕、移动鼠标、点击按钮、敲击键盘,直接操控计算机完成复杂任务 。
这不是一次常规的版本迭代,而是AI发展史上的关键跃迁。当业界还在讨论AI的”推理能力”和”上下文长度”时,Anthropic已经将战场转移到了更具实用价值的维度——执行能力。Claude的这次进化,标志着AI从”被动的建议者”正式迈向”主动的执行者”,从”只会吹水的文科生”变成了”能真正做事的操作员” 。

三大技术突破:让AI从”对话”走向”执行”
突破一:Computer Use——AI的”视觉”与”触觉”
Claude最具革命性的创新,在于其原生计算机使用能力(Computer Use)。这并非外挂插件或预设脚本,而是模型内生的视觉感知与操作能力 。
具体而言,Claude具备以下能力:
- 视觉界面理解:通过截图感知屏幕上的按钮、输入框、菜单、图标的位置与状态
- 精准坐标操作:根据视觉识别结果计算元素位置,执行鼠标点击与拖拽
- 键盘输入模拟:在指定输入框中键入文本,支持快捷键组合与特殊字符
- 跨应用协作:在浏览器、Excel、邮件客户端、文件管理器之间无缝切换执行任务
一个具体场景足以展示这种变革的力量:以往,整理一份包含数百条客户信息的Excel表格,按地区分类、计算销售额、生成可视化图表,需要人工操作约30分钟。而现在,用户只需对Claude发出指令:”帮我把这份客户数据按华东、华北、华南分类,计算各区域销售额,并生成柱状图”,Claude便能自主打开Excel,识别界面元素,点击菜单、选择数据、输入公式、生成图表,全程无需人工干预 。
更 radical 的是,Claude的Computer Use能力不再需要API接口或CLI化改造,任何传统软件——无论是老旧的企业管理系统还是Photoshop、视频剪辑等专业创意软件——都纳入了Claude的操控范围 。
突破二:Claude Code远程控制——打破设备边界的”数字分身”
配合Computer Use能力,Anthropic同步上线了远程控制功能(Remote Control)。用户在外面用手机给Claude派活,它在家里或公司的电脑上就能自动把活干完,无需守在电脑前 。
这一功能的核心价值在于:
- 移动接力:打通了手机与电脑的对话链路,用户可远程下达指令
- 自动处理:Claude自动处理邮件、数据汇总、代码调试等任务
- 会话持久:基于Claude模型的云同步,实现跨设备的状态持久性
从商业角度来看,Remote Control功能为软件开发和IT服务公司提供了实质机会。它解决了远程工作设置中的关键痛点——开发者常常因移动限制而面临中断。通过启用无缝会话切换,Claude Code可以增强团队协作,允许实时代码审查或编辑 。
市场分析显示,像GitHub Copilot和Amazon CodeWhisperer这样的AI编码助手已经占据了显著份额,Copilot截至2023年中期拥有超过100万用户。Anthropic的这一功能使其在竞争中脱颖而出,可能吸引注重工作生活平衡的自由职业者和远程团队 。
突破三:Claude Cowork——非开发者的”文件系统访问”革命
如果说Claude Code主要面向开发者,那么Claude Cowork则是向普通用户的重大延伸。这是首次,非开发者可以让Claude直接访问他们计算机的文件系统,实现之前仅对技术用户可能的自主、上下文感知工作 。
Claude Cowork的核心能力包括:
- 直接文件系统访问:读取现有文件以理解上下文,基于指示编辑文档,从头创建新文件,系统地组织和重命名文件
- 自主任务完成:为完成请求制定自己的计划,独立执行任务同时让用户了解最新进展,处理多步工作流,适应意外情况
- 明确的控制和安全性:文件夹级权限(Claude仅看到明确共享的内容),操作批准系统(重大更改前请求许可),透明操作(整个过程中用户都了解最新情况)
正如Anthropic所述:”Claude将制定计划并稳步完成,同时让你了解它的进展” 。
安全设计:AI”动手能力”的刹车系统
如此强大的执行能力,必然伴随安全风险。Anthropic在安全设计上做了分层考虑 :
- 权限优先级:Claude会优先调用已经授权过的集成能力(如Slack、日历、Google Workspace等),只有当工具没有对应连接器时,才会申请操作桌面的权限
- 用户确认机制:所有敏感操作(删除文件、提交表单、发送消息等)都会先弹出确认请求,用户同意后才会执行
- 环境隔离:官方明确推荐用户在Docker隔离环境中运行这个功能,从底层降低操作风险
- 随时中断:访问新应用需经用户授权,并支持随时中断Claude的操作
目前,Computer Use功能已向所有Claude Pro和Max用户开放,更新到最新版的桌面端Claude应用,配对手机端账号后就能在设置里开启预览权限。目前功能是macOS独占,官方表示后续会根据用户反馈快速迭代,很快就会支持Windows和Linux系统 。
对知识工作的颠覆:效率革命的临界点
Claude的这次进化,标志着AI从”对话工具”向”执行智能体”的关键跃迁。在多个基准测试中,Claude展现了强大的竞争力:
| 基准测试 | Claude表现 | 说明 |
| SWE-Bench Verified | 80.80% | 软件工程任务验证集,领先GPT-5.4的77.2% |
| SWE-Bench Pro | ~45.9% | 高难度软件工程任务,略低于GPT-5.4的57.7% |
| Terminal-Bench | 65.40% | 终端操作任务,低于GPT-5.4的75.1% |
| OSWorld 电脑操控 | 72.70% | 接近人类基线72.4%,GPT-5.4为75.0% |
| MMMU-Pro 视觉推理 | 85.10% | 视觉推理任务,领先GPT-5.4的81.2% |
这些数据揭示了一个趋势:在编程和视觉推理领域,Claude保持领先;在终端操作和自动化任务上,GPT-5.4略胜一筹。两者的竞争,正在推动AI能力边界的快速扩展。
对于企业而言,部署Claude的紧迫性不在于”替代员工”,而在于”赋能团队”。率先掌握这一工具的团队,将在效率、创新速度、响应能力上获得显著竞争优势。
在这场AI能力竞赛中,网络基础设施的质量往往被忽视却至关重要。当企业构建基于Claude的自动化工作流时,API调用的稳定性、上下文数据的传输速度、多地域部署的响应延迟,都直接影响AI智能体的执行效率。IPFLY的全球代理网络,覆盖190多个国家和地区,提供毫秒级响应的住宅IP和数据中心IP,确保企业AI应用在全球任意地点都能获得稳定、快速的网络支撑,让Claude的能力不受网络瓶颈限制 。

Claude的”动手能力”革命已经到来。当竞争对手还在用传统方式填写Excel、操作ERP、处理邮件时,率先部署Claude的企业已经让AI智能体7×24小时自动执行这些任务。现在就开始探索Claude的Computer Use、远程控制、Claude Cowork等突破性技术——无论是通过Claude Pro/Max订阅,还是通过API集成到企业工作流。
在这场AI效率革命中,网络基础设施的质量决定转型的成败。IPFLY的全球代理网络,覆盖190多个国家和地区,提供毫秒级响应的高纯净IP资源,确保Claude API调用稳定、快速、不受地域限制。无论是需要固定IP的企业级API对接,还是需要全球分布的住宅IP进行多地域测试,IPFLY都能提供精准匹配的网络方案。99.9%稳定运行时间保障,7×24小时技术支持,更有免费测试让企业在投入前验证效果。立即注册IPFLY,为AI智能体配备世界级的网络基础设施,在Claude时代抢占先机。