Awesome-omni-skill claude-web-server-llm

多线程Claude Web服务器,使用FastAPI将Claude暴露为后端API服务。此服务器会话持久化、支持并发处理、可基于用户语义调用所有skills/agents/subagents直至完成输出给用户。使用场景:(1)启动Claude作为Web服务供其他应用调用,(2)通过API集成Claude能力到现有系统,(3)构建基于Claude的应用后端。此skill仅用于启动和管理服务器本身,不直接处理知识库查询或代码分析任务。(4)通过任务的形式用_execute_subtask_direct发送邮件。

install
source · Clone the upstream repo
git clone https://github.com/diegosouzapw/awesome-omni-skill
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/diegosouzapw/awesome-omni-skill "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/development/claude-web-server-llm" ~/.claude/skills/diegosouzapw-awesome-omni-skill-claude-web-server-llm && rm -rf "$T"
manifest: skills/development/claude-web-server-llm/SKILL.md
source content

Claude Web Server LLM

多线程Claude Web服务器,使用Claude作为后端进行语义路由和智能调度。

功能特性

  • 持久化Claude会话(通过claude --print命令交互)
  • 多线程并发处理(ThreadPoolExecutor)
  • 自动发现所有skills、agents、subagents
  • 基于LLM语义分析智能路由到skills、agents、subagents
  • 无法判定时直接调用Claude处理直至完成
  • RESTful API接口
  • 会话管理和隔离
  • WebUI前端界面
  • 支持多模型后端(Claude、NVIDIA、Deepseek)

快速开始

# 启动服务器
python3 /home/will/.claude/skills/claude-web-server-llm/scripts/server.py

# 或使用启动脚本
bash /home/will/.claude/skills/claude-web-server-llm/run.sh

# 访问Web界面
# http://localhost:8085

架构设计

Web Server (8085端口)
├── 会话管理
│   ├── Session 1 → Claude/模型调用
│   ├── Session 2 → Claude/模型调用
│   └── Session N → Claude/模型调用
├── 语义调度系统
│   ├── Skill发现模块 (~/.claude/skills/)
│   ├── Agent类型识别 (Bash, Explore, Plan等)
│   └── LLM语义分析器 (智能路由)
├── 多模型后端
│   ├── Claude (opus, sonnet, haiku)
│   ├── NVIDIA API
│   └── Deepseek API
└── 前端WebUI (浏览器界面)
    ├── 输入窗口 (底部)
    ├── 输出窗口 (顶部)
    └── 模型选择

API端点

会话管理

  • POST /api/session
    - 创建新会话
  • GET /api/session/{session_id}
    - 获取会话信息
  • DELETE /api/session/{session_id}
    - 删除会话

消息交互

  • POST /api/send
    - 发送消息到Claude
  • POST /api/claude
    - 直接调用Claude处理
  • GET /api/messages/{session_id}
    - 获取会话消息历史

资源发现

  • GET /api/skills
    - 列出所有可用skills
  • GET /api/agents
    - 列出所有agents
  • GET /api/skills/summary
    - 获取skills摘要

使用场景

场景使用方法
启动服务器用户说"启动Claude web llm服务器"
查看服务状态访问 http://localhost:8085/api/status
获取可用资源访问 http://localhost:8085/api/skills
发送消息POST 到 /api/send 端点

配置说明

参数默认值说明
server_port
8085服务器监听端口
max_sessions
100最大同时会话数
worker_threads
16工作线程数
claude_executable
claudeClaude可执行文件路径
session_timeout
3600会话超时时间(秒)

注意事项

  1. 此skill仅用于启动和管理web服务器本身
  2. 通过API调用Claude时,语义调度系统会智能判断使用何种skill/agent/subagent
  3. 无法明确判断的请求会直接发给Claude处理
  4. 服务器运行后,可以通过Web界面或API与Claude交互