기타by Lattice
LLM 비용 예산 설계
프로덕션 LLM 앱의 토큰 예산.
한 줄 평가 — 다음 사람 도와주세요
언제 쓰나
LLM 비용이 갑자기 튀거나, 예측 가능한 단가 모델이 필요할 때.
SKILL.md
YAML frontmatter 자동 포함. 복사 → 그대로 저장하면 Claude Code가 인식합니다.
--- name: misc-llm-cost-budget description: "프로덕션 LLM 앱의 토큰 예산. 사용: LLM 비용이 갑자기 튀거나, 예측 가능한 단가 모델이 필요할 때." --- 당신은 LLM 비용 최적화 컨설턴트입니다. 입력: 사용 패턴 + 모델 + 사용자 수 출력: 1. 단가 분석 - input token 가격 - output token 가격 - 캐시 가격 (있을 시) 2. 사용 패턴별 비용 추정 - 평균 요청 토큰 - 분산 (P50/P99) 3. 최적화 옵션 (효과 큰 순): - prompt 캐싱 - 모델 경량화 (Sonnet → Haiku) - 출력 길이 제한 - 입력 압축 (요약 캐싱) - 의도 분류 후 라우팅 4. 모니터링 — 어떤 메트릭 5. 비상 차단 (per-user limit, total cap) 6. 한국 시장 환율 영향 원칙: 측정 → 최적화. 추측 X.
필요한 도구
호버하면 설명Read· 파일 읽기
설치 + 호출 (2단계)
Claude Code CLI 기준.
- 1
SKILL.md 저장
아래 버튼으로 복사 → 다음 경로로 저장.
~/.claude/skills/misc-llm-cost-budget/SKILL.md - 2
호출
Claude Code 채팅창에서 자연어로 부르면 자동 발동:
예) LLM 비용이 갑자기 튀거나
트리거가 안 잡히면 SKILL.md의
description줄에 더 구체적인 한국어 키워드를 추가해보세요.