从Claude Code到Claude Cowork：Anthropic如何用”动手能力”颠覆AI赛道

8次阅读

Anthropic毫无预警地扔出了一颗足以重新定义AI能力边界的产品升级——Claude不再局限于对话框内的文本交互，而是真正长出了”手”和”眼”，能够像人类一样观察屏幕、移动鼠标、点击按钮、敲击键盘，直接操控计算机完成复杂任务。

这不是一次常规的版本迭代，而是AI发展史上的关键跃迁。当业界还在讨论AI的”推理能力”和”上下文长度”时，Anthropic已经将战场转移到了更具实用价值的维度——执行能力。Claude的这次进化，标志着AI从”被动的建议者”正式迈向”主动的执行者”，从”只会吹水的文科生”变成了”能真正做事的操作员” 。

三大技术突破：让AI从”对话”走向”执行”

突破一：Computer Use——AI的”视觉”与”触觉”

Claude最具革命性的创新，在于其原生计算机使用能力（Computer Use）。这并非外挂插件或预设脚本，而是模型内生的视觉感知与操作能力。

具体而言，Claude具备以下能力：

视觉界面理解：通过截图感知屏幕上的按钮、输入框、菜单、图标的位置与状态
精准坐标操作：根据视觉识别结果计算元素位置，执行鼠标点击与拖拽
键盘输入模拟：在指定输入框中键入文本，支持快捷键组合与特殊字符
跨应用协作：在浏览器、Excel、邮件客户端、文件管理器之间无缝切换执行任务

一个具体场景足以展示这种变革的力量：以往，整理一份包含数百条客户信息的Excel表格，按地区分类、计算销售额、生成可视化图表，需要人工操作约30分钟。而现在，用户只需对Claude发出指令：”帮我把这份客户数据按华东、华北、华南分类，计算各区域销售额，并生成柱状图”，Claude便能自主打开Excel，识别界面元素，点击菜单、选择数据、输入公式、生成图表，全程无需人工干预。

更 radical 的是，Claude的Computer Use能力不再需要API接口或CLI化改造，任何传统软件——无论是老旧的企业管理系统还是Photoshop、视频剪辑等专业创意软件——都纳入了Claude的操控范围。

突破二：Claude Code远程控制——打破设备边界的”数字分身”

配合Computer Use能力，Anthropic同步上线了远程控制功能（Remote Control）。用户在外面用手机给Claude派活，它在家里或公司的电脑上就能自动把活干完，无需守在电脑前。

这一功能的核心价值在于：

移动接力：打通了手机与电脑的对话链路，用户可远程下达指令
自动处理：Claude自动处理邮件、数据汇总、代码调试等任务
会话持久：基于Claude模型的云同步，实现跨设备的状态持久性

从商业角度来看，Remote Control功能为软件开发和IT服务公司提供了实质机会。它解决了远程工作设置中的关键痛点——开发者常常因移动限制而面临中断。通过启用无缝会话切换，Claude Code可以增强团队协作，允许实时代码审查或编辑。

市场分析显示，像GitHub Copilot和Amazon CodeWhisperer这样的AI编码助手已经占据了显著份额，Copilot截至2023年中期拥有超过100万用户。Anthropic的这一功能使其在竞争中脱颖而出，可能吸引注重工作生活平衡的自由职业者和远程团队。

突破三：Claude Cowork——非开发者的”文件系统访问”革命

如果说Claude Code主要面向开发者，那么Claude Cowork则是向普通用户的重大延伸。这是首次，非开发者可以让Claude直接访问他们计算机的文件系统，实现之前仅对技术用户可能的自主、上下文感知工作。

Claude Cowork的核心能力包括：

直接文件系统访问：读取现有文件以理解上下文，基于指示编辑文档，从头创建新文件，系统地组织和重命名文件
自主任务完成：为完成请求制定自己的计划，独立执行任务同时让用户了解最新进展，处理多步工作流，适应意外情况
明确的控制和安全性：文件夹级权限（Claude仅看到明确共享的内容），操作批准系统（重大更改前请求许可），透明操作（整个过程中用户都了解最新情况）

正如Anthropic所述：”Claude将制定计划并稳步完成，同时让你了解它的进展” 。

安全设计：AI”动手能力”的刹车系统

如此强大的执行能力，必然伴随安全风险。Anthropic在安全设计上做了分层考虑：

权限优先级：Claude会优先调用已经授权过的集成能力（如Slack、日历、Google Workspace等），只有当工具没有对应连接器时，才会申请操作桌面的权限
用户确认机制：所有敏感操作（删除文件、提交表单、发送消息等）都会先弹出确认请求，用户同意后才会执行
环境隔离：官方明确推荐用户在Docker隔离环境中运行这个功能，从底层降低操作风险
随时中断：访问新应用需经用户授权，并支持随时中断Claude的操作

目前，Computer Use功能已向所有Claude Pro和Max用户开放，更新到最新版的桌面端Claude应用，配对手机端账号后就能在设置里开启预览权限。目前功能是macOS独占，官方表示后续会根据用户反馈快速迭代，很快就会支持Windows和Linux系统。

对知识工作的颠覆：效率革命的临界点

Claude的这次进化，标志着AI从”对话工具”向”执行智能体”的关键跃迁。在多个基准测试中，Claude展现了强大的竞争力：

基准测试	Claude表现	说明
SWE-Bench Verified	80.80%	软件工程任务验证集，领先GPT-5.4的77.2%
SWE-Bench Pro	~45.9%	高难度软件工程任务，略低于GPT-5.4的57.7%
Terminal-Bench	65.40%	终端操作任务，低于GPT-5.4的75.1%
OSWorld 电脑操控	72.70%	接近人类基线72.4%，GPT-5.4为75.0%
MMMU-Pro 视觉推理	85.10%	视觉推理任务，领先GPT-5.4的81.2%

这些数据揭示了一个趋势：在编程和视觉推理领域，Claude保持领先；在终端操作和自动化任务上，GPT-5.4略胜一筹。两者的竞争，正在推动AI能力边界的快速扩展。

对于企业而言，部署Claude的紧迫性不在于”替代员工”，而在于”赋能团队”。率先掌握这一工具的团队，将在效率、创新速度、响应能力上获得显著竞争优势。

在这场AI能力竞赛中，网络基础设施的质量往往被忽视却至关重要。当企业构建基于Claude的自动化工作流时，API调用的稳定性、上下文数据的传输速度、多地域部署的响应延迟，都直接影响AI智能体的执行效率。IPFLY的全球代理网络，覆盖190多个国家和地区，提供毫秒级响应的住宅IP和数据中心IP，确保企业AI应用在全球任意地点都能获得稳定、快速的网络支撑，让Claude的能力不受网络瓶颈限制。

Claude的”动手能力”革命已经到来。当竞争对手还在用传统方式填写Excel、操作ERP、处理邮件时，率先部署Claude的企业已经让AI智能体7×24小时自动执行这些任务。现在就开始探索Claude的Computer Use、远程控制、Claude Cowork等突破性技术——无论是通过Claude Pro/Max订阅，还是通过API集成到企业工作流。

在这场AI效率革命中，网络基础设施的质量决定转型的成败。IPFLY的全球代理网络，覆盖190多个国家和地区，提供毫秒级响应的高纯净IP资源，确保Claude API调用稳定、快速、不受地域限制。无论是需要固定IP的企业级API对接，还是需要全球分布的住宅IP进行多地域测试，IPFLY都能提供精准匹配的网络方案。99.9%稳定运行时间保障，7×24小时技术支持，更有免费测试让企业在投入前验证效果。立即注册IPFLY，为AI智能体配备世界级的网络基础设施，在Claude时代抢占先机。

正文完