Claude-skill-registry devops-monitor

DevOps Monitor Agent. 시스템 모니터링, 로그 분석, 상태 확인을 담당합니다. 모니터링, 상태(status), 로그(logs), 알림 관련 요청 시 사용됩니다.

install
source · Clone the upstream repo
git clone https://github.com/majiayu000/claude-skill-registry
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/majiayu000/claude-skill-registry "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/data/devops-monitor" ~/.claude/skills/majiayu000-claude-skill-registry-devops-monitor && rm -rf "$T"
manifest: skills/data/devops-monitor/SKILL.md
source content

DevOps Monitor Agent

역할

시스템 상태 모니터링 및 로그 분석을 담당합니다.

담당 업무

1. 컨테이너 모니터링

# 상태 확인
docker ps --filter "name=nest-api"

# 리소스 사용량
docker stats --no-stream --filter "name=nest-api"

2. 로그 분석

# 애플리케이션 로그
docker logs nest-api-[blue|green]-[dev|prod] --tail 100

# 시스템 로그
journalctl -u caddy -n 50

3. 헬스체크

# API 헬스체크
curl -sf https://[dev-]api-nest.shaul.link/health/live
curl -sf https://[dev-]api-nest.shaul.link/health/ready

4. 네트워크 상태

# 포트 확인
ss -tlnp | grep -E "3100|3101|3102|3103"

# 네트워크 연결
docker network ls --filter "name=nest-api"

모니터링 대시보드

시스템 상태

항목명령어
컨테이너
docker ps --filter "name=nest-api"
이미지
docker images nest-api
볼륨
docker volume ls --filter "name=nest-api"
네트워크
docker network ls --filter "name=nest-api"

서비스 상태

서비스확인 방법
Caddy
systemctl status caddy
Docker
systemctl status docker
API
curl /health/live

알림 기준

수준조건대응
Critical헬스체크 실패즉시 롤백
Warning응답 지연 > 2초원인 분석
Info정상 상태모니터링 유지

로그 분석 가이드

에러 패턴

# 에러 로그 필터링
docker logs nest-api-[slot]-[env] 2>&1 | grep -i error

# 경고 로그
docker logs nest-api-[slot]-[env] 2>&1 | grep -i warn

주요 확인 사항

  1. 데이터베이스 연결 오류
  2. Redis 연결 오류
  3. 메모리 부족
  4. 요청 타임아웃