Commonly-used-high-value-skills agent-hub
用于多 Agent 系统编排、Agent 间通信协议设计与生命周期管理。来源:alirezarezvani/claude-skills POWERFUL tier。
install
source · Clone the upstream repo
git clone https://github.com/seaworld008/Commonly-used-high-value-skills
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/seaworld008/Commonly-used-high-value-skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/ai-agent-platform/agent-hub" ~/.claude/skills/seaworld008-commonly-used-high-value-skills-agent-hub-cae5e3 && rm -rf "$T"
manifest:
skills/ai-agent-platform/agent-hub/SKILL.mdsource content
Agent Hub
触发条件
- 当需要设计和实现多智能体系统(Multi-Agent System, MAS)时。
- 在构建复杂的任务编排流程(Workflow Orchestration),且单一 Agent 无法胜任时。
- 需要管理 Agent 的生命周期、状态、并发和通信协议时。
- 系统需要具备高可用性、故障转移(Failover)和负载均衡能力时。
- 需要定义 Agent 间的标准消息交换格式(如 JSON-RPC, MCP 等)时。
核心能力
1. Agent 注册与发现机制 (Registration & Discovery)
- 注册中心 (Registry): 所有活动的 Agent 必须在注册中心进行身份登记,包括其能力(Capability)、所支持的工具(Tools)、输入/输出 schema。
- 动态发现: 系统运行过程中,编排层能够实时查询当前可用的 Agent 列表及其负载状态。
- 能力建模: 使用语义化描述或标签系统来定义 Agent 的专长领域。
2. 消息路由与通信协议 (Routing & Protocol)
- 异步通信: 采用消息队列(如 RabbitMQ/Redis)实现 Agent 间的解耦。
- 消息路由策略:
- 点对点 (P2P): 特定任务指派。
- 广播 (Broadcast): 寻找能够处理某一任务的 Agent。
- 基于内容的路由: 根据任务的复杂度或领域自动分发。
- 标准协议: 采用统一的 Envelope 包装(包含 TraceID, Priority, Timestamp, Payload)。
3. 多样化编排模式 (Orchestration Patterns)
- Sequential (顺序模式): 任务 A 完成后,其输出作为任务 B 的输入。
- Parallel (并行模式): 多个 Agent 同时处理子任务,最后由 Aggregator 聚合结果。
- Router (路由模式): 主控 Agent 根据输入意图,将请求分发至最合适的子 Agent。
- Evaluator/Optimizer (评审模式): 一个 Agent 生成内容,另一个 Agent 进行质量审核和优化建议。
- Hierarchy (层级模式): 复杂的层级管理,Manager Agent 拆分任务并管理多个 Worker Agent。
4. 生命周期与状态管理 (Lifecycle & State Management)
- 生命周期钩子:
,onInit
,onTaskStart
,onTaskComplete
。onShutdown - 状态持久化: 在任务执行过程中,定期保存内存上下文(Memory Snapshot),防止系统崩溃导致数据丢失。
- 上下文管理: 管理共享记忆(Shared Memory)与私有记忆(Private Memory)的权限和同步。
5. 高可用与负载均衡 (Reliability)
- 状态监控: 定期发送 Heartbeat,检测 Agent 是否存活。
- 故障转移 (Failover): 若 Worker Agent A 异常退出,任务自动重定向至备用的 Worker Agent B。
- 重试机制: 指数级退避(Exponential Backoff)重试策略。
- 流控与熔断: 防止过量请求击穿下游 Agent 服务。
6. 安全与权限控制 (Security)
- 双向认证 (mTLS): 确保 Agent 间通信的合法性。
- 资源限额 (Quotas): 限制单个 Agent 的 Token 消耗、API 调用次数。
- 隔离沙箱: 对于执行代码的 Agent,强制要求在受限容器内运行。
常用命令/模板
Agent 定义 JSON 模板
{ "agent_id": "data-analyst-001", "role": "data_analysis", "capabilities": ["SQL generation", "Pandas visualization"], "endpoint": "http://agents.internal/v1/analyze", "status": "healthy", "last_heartbeat": "2026-03-27T10:00:00Z" }
任务调度命令示例
# 启动多 Agent 编排集群 agent-hub run --config ./orchestration/multi-agent-config.yaml # 查看当前活跃 Agent 负载 agent-hub status --verbose # 手动触发 Agent 故障转移测试 agent-hub kill data-analyst-001 && agent-hub check-failover
编排 DSL 示例 (YAML)
pipeline: name: market_research_flow steps: - step1: agent: scraper_agent task: fetch_latest_news - step2: agent: summarizer_agent input: step1.output task: extract_key_points - step3: agent: writer_agent input: step2.output task: create_final_report
边界与限制
- 延迟问题: 多次 Agent 间的往返(Round-trip)会增加整体系统的响应延迟。
- 幻觉累积: 链式编排中,上游 Agent 的错误输出会被下游 Agent 放大。
- 调试难度: 分布式 Agent 系统的 Trace 追踪比单体系统复杂得多。
- Token 消耗: 并行和多 Agent 协同会显著提高 Token 成本。
- 同步冲突: 多个 Agent 同时修改共享状态(Shared Memory)可能导致数据竞争(Race Condition)。
注:本技能适用于企业级 AI Agent 应用开发,需配合成熟的编排框架如 LangChain/AutoGen 使用。
- lines: 110
- word count: ~1000 characters
- detailed best practices included.