Claude Code 动态工作流:10-100 个并行子 Agent 的工程革命

Anthropic 推出 Claude Code 动态工作流,单个会话运行数十到数百个并行子 Agent,自动验证后再交付。Bun 从 Zig 移植到 Rust 仅用 11 天,75 万行代码,99.8% 测试通过率。

开篇:从季度规划到几天完成的范式转移

2026 年 5 月,Anthropic 推出了 Claude Code 的一个重大更新:动态工作流(Dynamic Workflows)

这不是一个简单的功能更新,而是 Agent 架构的范式转移:

原本你按季度规划的工作,现在可以在几天内完成。

核心能力一句话概括:

Claude 会动态编写编排脚本,在单个会话中运行数十到数百个并行子 Agent,在结果到达你之前对工作进行验证。


第一层:理解动态工作流的核心机制

1.1 单 Agent 的极限

有些问题对于单个 Agent 的单次处理来说太庞大了,尤其是在复杂的遗留代码库中:

  • 在整个服务范围内进行 bug 搜索:需要扫描数千个文件,追踪依赖链
  • 触及数百个文件的迁移工作:API 底弃、框架替换、语言移植
  • 需要从各个角度压力测试的方案:安全审计、性能优化、兼容性检查

单个 Agent 面对这些任务时,要么超时、要么出错、要么陷入无限循环。核心问题是:

Agent 的上下文窗口有限,处理复杂度有限,无法同时处理”全局视角”和”局部细节”。

1.2 动态工作流的突破

动态工作流的突破在于:把任务分解成子任务,扇出到并行子 Agent,结果验证后再合并

用户请求

Claude 动态规划(生成编排脚本)

任务分解 → 子任务列表

扇出到并行子 Agent(10-100 个)
    ├─ Agent 1: 处理子任务 A
    ├─ Agent 2: 处理子任务 B
    ├─ Agent 3: 处理子任务 C
    ├─ ...
    ├─ Agent N: 处理子任务 N

结果验证(独立验证 + 对抗性验证)

答案收敛 → 单一协调一致的答案

交付给用户

1.3 核心特性

特性说明
动态规划Claude 根据你的提示自动生成编排脚本,不是预定义模板
并行扇出子任务并行运行,不阻塞主会话
自动验证结果在合并前经过独立验证,确保真实问题
对抗性验证其他 Agent 尝试打破结论,迭代直到答案收敛
断点续传进度保存,中断后从断点恢复
长时间运行可以持续数小时乃至数天

第二层:三大实战场景

2.1 代码库范围的审计

场景:bug 搜索、性能优化审计、安全审计

传统做法

  1. 运行静态分析工具
  2. 人工审查报告
  3. 标记问题
  4. 逐一验证

动态工作流做法

  1. Claude 并行搜索服务或仓库(数百个 Agent 同时工作)
  2. 每个 Agent 发现问题后独立验证
  3. 对抗性 Agent 尝试反驳每个发现
  4. 只有经过双重验证的问题才进入最终报告

效果

  • 覆盖率提升:从局部扫描变成全代码库扫描
  • 准确率提升:独立验证 + 对抗验证减少假阳性
  • 速度提升:并行处理,从周级变成小时级

加固检查模式

  • 认证检查:扫描所有认证相关代码
  • 输入验证:扫描所有用户输入处理
  • 不安全模式排查:扫描所有危险操作

2.2 大规模迁移和现代化工程

场景:框架替换、API 底弃、语言移植

案例:Bun 从 Zig 移植到 Rust

这个案例是动态工作流能力的极致展示:

指标数据
源语言Zig
目标语言Rust
代码量~75 万行 Rust 代码
测试通过率99.8%
时间11 天(从第一次提交到合并)
工作流数量3 个主工作流 + 1 个优化工作流

工作流分解

  1. 第一个工作流:生命周期映射

    • 为 Zig 代码库中每个结构体字段映射正确的 Rust 生命周期
    • 这是 Zig → Rust 最难的部分(生命周期系统差异巨大)
  2. 第二个工作流:文件级移植

    • 每个 .rs 文件编写为对应 .zig 文件的行为等价移植
    • 数百个 Agent 并行工作
    • 每个文件配有两个审查者(验证 Agent)
  3. 第三个工作流:修复循环

    • 驱动构建和测试套件直到两者都通过
    • 自动修复编译错误和测试失败
  4. 第四个工作流:优化审计

    • 通宵运行
    • 处理不必要的数据拷贝
    • 为每个修改开 PR 供最终审查

关键洞察

虽然尚未投入生产,但所有这些都由动态工作流完成。

这意味着:工作流不只是辅助工具,而是可以承担完整的、复杂的、生产级别的工程任务。

2.3 需要双重检查的关键工作

场景:错误答案代价很高的任务

模式

  1. Agent 从独立角度解决问题
  2. 其他 Agent 尝试反驳发现
  3. 运行不断迭代直到答案收敛

应用场景

  • 安全相关的代码变更(加密算法、认证逻辑)
  • 高风险的架构决策(数据库迁移、缓存策略)
  • 生产级别的重构(核心模块重写)

第三层:技术原理深度解析

3.1 扇出-验证-收敛架构

动态工作流的核心架构可以抽象为三个阶段:

┌─────────────────────────────────────────────────────────────┐
│                    FAN-OUT(扇出)                           │
│  Claude 根据提示动态规划,将任务分解为子任务,                │
│  并将工作扇出到并行运行的子 Agent 中                         │
└─────────────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────────────┐
│                    VALIDATE(验证)                          │
│  结果在被纳入之前经过检查:                                   │
│  - 独立验证:另一个 Agent 验证结果                           │
│  - 对抗验证:Agent 尝试打破结论                               │
└─────────────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────────────┐
│                    CONVERGE(收敛)                          │
│  迭代直到答案收敛,最终得到单一、协调一致的答案               │
└─────────────────────────────────────────────────────────────┘

3.2 动态编排脚本

关键创新:Claude 动态编写编排脚本,而不是使用预定义模板。

这意味着:

  • 编排脚本是根据任务特性生成的
  • 可以处理未预见的情况
  • 可以动态调整策略

与传统工作流的区别

传统工作流动态工作流
预定义步骤动态生成步骤
固定 Agent 数量根据任务规模调整
线性执行并行 + 验证 + 收敛
错误处理硬编码动态错误处理
无断点续传进度保存 + 恢复

3.3 对抗性验证

对抗性验证是动态工作流的独特设计:

Agent 从独立角度解决问题,其他 Agent 尝试反驳它们的发现。

这类似于学术界的研究方法:

  • 研究者提出结论
  • 同行评审尝试反驳
  • 最终共识形成

在工程场景中:

  • Agent A:提出”这里存在安全漏洞”
  • Agent B(对抗者):尝试证明”这不是真正的漏洞”
  • 如果 Agent B 成功,Agent A 的结论被驳回
  • 如果 Agent B 失败,Agent A 的结论被验证

效果:假阳性率大幅下降,报告可信度大幅提升。


第四层:与传统 Agent 架构的对比

4.1 单 Agent 架构的局限

传统 Agent 架构:

用户 → Agent → 执行 → 结果

局限:

  • 上下文窗口限制:无法处理大规模代码库
  • 串行处理:效率低下
  • 无验证机制:结果可信度依赖 Agent 自身
  • 无断点续传:中断后从头开始

4.2 简单多 Agent 架构的局限

简单多 Agent 架构:

用户 → Agent A → Agent B → Agent C → 结果

局限:

  • 串行依赖:Agent B 必须等 Agent A 完成
  • 固定流程:无法动态调整
  • 无对抗验证:没有独立验证机制

4.3 动态工作流的优势

动态工作流架构:

用户 → Claude(动态规划)

    并行 Agent 网格
    ├─ 任务 Agent
    ├─ 验证 Agent
    ├─ 对抗 Agent

    验证 → 收敛 → 结果

优势:

  • 动态规划:根据任务特性生成编排脚本
  • 并行执行:效率提升 10-100 倍
  • 双重验证:独立验证 + 对抗验证
  • 断点续传:长时间运行 + 中断恢复

第五层:最佳实践与注意事项

5.1 如何启动动态工作流

两种方式

  1. 直接请求

    "Create a workflow to search for security vulnerabilities in this codebase"
  2. 开启 ultracode 设置

    • 通过 effort 菜单访问
    • 设置 effort 级别为 xhigh
    • Claude 自动决定何时使用工作流

5.2 最佳实践

实践说明
从限定范围开始动态工作流消耗大量 Token,先用小任务测试
开启 auto 模式获得最佳体验
明确任务边界清晰定义任务范围,避免无限扩展
监控 Token 消耗动态工作流消耗可能远超典型会话
审查验证结果最终结果仍需人工审查

5.3 注意事项

Token 消耗警告

动态工作流消耗的 Token 可能远超典型的 Claude Code 会话。

原因:

  • 多个并行 Agent 消耗
  • 验证 Agent 消耗
  • 对抗 Agent 消耗
  • 长时间运行消耗

建议

  • 先从限定范围的任务开始
  • 了解在你工作中的使用量
  • 监控账单

组织管理

  • 工作流首次触发时,Claude Code 会请求确认
  • 管理员可以通过托管设置禁用工作流

第六层:可用性与定价

6.1 可用性

计划默认状态
Max默认开启
Team默认开启
Enterprise默认关闭(需管理员启用)
API默认开启
Amazon Bedrock支持
Vertex AI支持
Microsoft Foundry支持

6.2 平台支持

  • Claude Code CLI
  • Claude Code 桌面版
  • VS Code 扩展

第七层:未来展望

7.1 Agent 架构的演进方向

动态工作流标志着 Agent 架构从”单 Agent”向”Agent 网络”的演进:

单 Agent → 多 Agent → Agent 网络 → Agent 生态系统

未来可能的方向:

  • Agent 特化:不同 Agent 专注于不同任务类型
  • Agent 协作协议:标准化的 Agent 间通信协议
  • Agent 市场:可租用的专业 Agent
  • Agent 持久化:长期运行的 Agent 状态保存

7.2 工程范式的变化

动态工作流带来的工程范式变化:

传统范式动态工作流范式
周级规划天级执行
人工验证自动验证
串行处理并行处理
局部视角全局视角
单次交付持续迭代

7.3 对开发者的影响

正面影响

  • 复杂任务的自动化程度大幅提升
  • 代码库级别的审计成为可能
  • 大规模迁移和重构不再需要数月

挑战

  • 需要学习新的工作流设计思维
  • Token 消耗管理成为新技能
  • 结果审查仍然重要(不能完全依赖自动验证)

总结:从工具到伙伴的跨越

Claude Code 动态工作流的推出,标志着 AI Agent 从”工具”向”伙伴”的跨越:

不只是辅助你完成任务,而是端到端承担整个任务。

Bun 重写案例是最有力的证明:

75 万行代码,11 天,99.8% 测试通过率,全部由动态工作流完成。

这不是科幻,这是现在。


附录:原文链接