Claude Code 공식문서 리뷰-Administration[6] : Claude Code 설정 - 비용을 효과적으로 관리하기(Manage costs effectively)
- -
안녕하세요! 갓대희입니다.
Claude Code Docs 공식 문서 >> [관리] 섹션의 내용 중 [Claude Code 설정 - 비용을 효과적으로 관리하기(Manage costs effectively)]를 살펴 보려고 합니다.
이번 섹션 부터는 영문, 한글번역본이 모두 공식문서로 존재하는 섹션이니 한글 문서를 편하게 참고 하셔도 될 것 같습니다.
https://code.claude.com/docs/ko/costs
비용을 효과적으로 관리하기 - Claude Code Docs
Claude Code 사용 시 토큰 사용량과 비용을 추적하고 최적화하는 방법을 알아봅니다.
code.claude.com
이 카테고리의 글은 편하게 공식 문서 위주의 내용을 눈으로 쭉 살펴 보고 넘어가는 목적을 갖고 시작 하게 되었습니다.
저도 초심으로 돌아가 기초적읜 글을 살펴보다보니, 지금와서 클로드에서 강조 하고자 하는 원칙이 어떤건지 되돌아볼 수 있는 계기가 되기도 하는 것 같아, 다른 분들도 꼭 한번 눈으로라도 이해 하고 넘어가는것이 좋다고 생각하여 공식 문서의 내용을 억지로 리뷰해보게 되었습니다.

Claude Code 비용
비용 구조, 추적 방법, 최적화 전략
Claude API와의 모든 상호작용은 토큰을 소비한다. 토큰은 텍스트의 기본 단위로, 대략 4글자(영어 기준) 또는 3/4 단어에 해당한다.
개발 작업에서 토큰이 어떻게 소비되는지 감을 잡아보자:
| 작업 유형 | 예상 토큰 | 비고 |
|---|---|---|
| "Hello World" 문자열 | ~3 토큰 | 가장 간단한 예시 |
| 100줄 Python 코드 | 500-800 토큰 | 코드 복잡도에 따라 다름 |
| 대화 한 턴 (질문 + 응답) | 1,000-3,000 토큰 | 평균적인 상호작용 |
| 중간 규모 파일 분석 | 5,000-10,000 토큰 | 파일 읽기 + 분석 + 응답 |
영어는 대략 4글자 = 1토큰이지만, 한글은 1-2글자 = 1토큰 정도로 더 많은 토큰을 사용한다. 한글로 작업할 때는 비용이 조금 더 높아질 수 있다.
개요
Claude Code의 비용 구조:
| 항목 | 비용 |
|---|---|
| 평균 비용 | 개발자당 일 $6 |
| 90번째 백분위 | 90%의 사용자가 일 $12 미만 |
| 월간 추정 | 개발자당 월 ~$100-200 (Sonnet 4.5 기준) |
모델별 비용 차이
Claude Code는 작업 특성에 따라 두 가지 모델을 자동 선택한다. 각 모델의 비용 특성을 이해하면 비용 최적화에 도움이 된다:
| 모델 | 사용 상황 | 비용 특성 |
|---|---|---|
| Sonnet 4.5 | 코드 작성, 리팩토링, 복잡한 분석 | 토큰당 비용 높음 (고성능) |
| Haiku 4.5 | 파일 탐색, 간단한 검색, 빠른 응답 | 토큰당 비용 낮음 (경량) |
Claude Code가 작업 복잡도에 따라 적절한 모델을 자동 선택한다. 복잡한 코딩 작업에는 Sonnet을, 파일 검색 같은 간단한 작업에는 Haiku를 사용한다.
작업별 예상 비용
실제 개발 시나리오별 예상 비용이다. 작업 복잡도와 코드베이스 크기에 따라 달라질 수 있다:
| 작업 시나리오 | 소요 시간 | 예상 비용 |
|---|---|---|
| 간단한 버그 수정 | 30분 | $0.50-1.00 |
| 코드 리뷰 및 피드백 | 1시간 | $1.00-2.00 |
| 새 기능 구현 | 2-3시간 | $2.00-4.00 |
| 대규모 리팩토링 | 반나절 | $3.00-6.00 |
비용 추적
/cost 명령어
/cost 명령어로 현재 세션의 상세 토큰 사용 통계를 확인할 수 있습니다:
Total cost: $0.55
Total duration (API): 6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes: 0 lines added, 0 lines removed
/cost 명령어는 Claude Max 및 Pro 구독자를 위한 것이 아닙니다.
Claude Console에서 비용 확인하기
과거 사용량과 상세 비용 내역은 Claude Console에서 확인할 수 있다:
- console.anthropic.com 접속
- 좌측 메뉴에서 Usage 클릭
- 기간별, 워크스페이스별 사용량 확인
| 메뉴 | 확인 가능 정보 | 필요 권한 |
|---|---|---|
| Usage | 일별/월별 토큰 사용량, 비용 추이 그래프 | Admin, Billing |
| Billing | 청구서, 결제 내역, 지출 한도 설정 | Admin |
| Workspaces | 워크스페이스별 사용량 분리 확인 | Admin |
Claude Code를 처음 인증하면 "Claude Code"라는 워크스페이스가 자동 생성된다. 이 워크스페이스는 Claude Code 전용이며, API 키를 생성할 수 없다.
지출 한도 설정
예상치 못한 비용 초과를 방지하려면 워크스페이스 지출 한도를 설정하자:
- Claude Console 접속
- Settings > Spend limits 이동
- 월간 또는 일간 한도 금액 입력
- 한도 도달 시 알림 또는 차단 설정 선택
팀 비용 관리
API 비용 관리
Claude API를 사용할 때 Claude Console을 통해 Claude Code 워크스페이스의 총 지출을 제한할 수 있습니다.
클라우드 제공자 추적 (Bedrock & Vertex)
Claude Code는 클라우드 배포에서 메트릭을 전송하지 않습니다. 대규모 엔터프라이즈 배포의 비용 메트릭은 LiteLLM을 고려할 수 있습니다.
LiteLLM은 Anthropic과 제휴되지 않은 서드파티 도구이며, Anthropic에서 보안 감사를 수행하지 않았다. 프로덕션 환경에서 사용 전에 자체 보안 검토를 수행하는 것을 권장한다.
권장 레이트 리밋
조직 규모에 따른 사용자당 권장 TPM (분당 토큰) 및 RPM (분당 요청):
| 팀 규모 | 사용자당 TPM | 사용자당 RPM |
|---|---|---|
| 1-5명 | 200k-300k | 5-7 |
| 5-20명 | 100k-150k | 2.5-3.5 |
| 20-50명 | 50k-75k | 1.25-1.75 |
| 50-100명 | 25k-35k | 0.62-0.87 |
| 100-500명 | 15k-20k | 0.37-0.47 |
| 500명+ | 10k-15k | 0.25-0.35 |
예시: 200명 x 20k TPM = 총 4백만 TPM
토큰 사용량 줄이기
대화 압축
| 기능 | 설명 |
|---|---|
| 자동 압축 | 컨텍스트가 95% 용량을 초과하면 기본적으로 활성화 |
| 토글 | /config > "Auto-compact enabled" 설정 |
| 수동 압축 | 컨텍스트가 커지면 /compact 명령어 사용 |
| 커스텀 지침 | /compact 코드 샘플과 API 사용에 집중해 |
CLAUDE.md 설정 예시:
# Summary instructions
When you are using compact, please focus on test output and code changes
/compact 실제 사용 예시
대화가 길어져 컨텍스트가 커졌을 때 /compact 명령어를 사용하면 이런 결과를 볼 수 있다:
> /compact
Compacting conversation...
Before: 45,231 tokens
After: 12,847 tokens
Saved: 32,384 tokens (71%)
특정 내용에 집중하도록 지시할 수도 있다:
> /compact 에러 해결 과정과 최종 코드 변경사항만 유지해줘
Compacting with custom instructions...
Before: 52,000 tokens
After: 8,234 tokens
Saved: 43,766 tokens (84%)
컨텍스트가 70-80% 정도 찼을 때 수동으로 압축하면 더 효과적이다. 95%에서 자동 압축되기를 기다리면 이미 많은 토큰을 소비한 후다.
비용 최적화 전략
- 구체적인 쿼리 작성: 불필요한 스캔을 유발하는 모호한 요청 피하기
- 복잡한 작업 분할: 큰 작업을 집중된 상호작용으로 나누기
- 작업 간 히스토리 정리:
/clear로 컨텍스트 초기화
비용 변동 요인
| 요인 | 영향 |
|---|---|
| 분석 중인 코드베이스 크기 | 클수록 비용 증가 |
| 쿼리 복잡성 | 복잡할수록 비용 증가 |
| 검색/수정 파일 수 | 많을수록 비용 증가 |
| 대화 기록 길이 | 길수록 비용 증가 |
| 대화 압축 빈도 | 자주 압축하면 비용 감소 |
백그라운드 토큰 사용
Claude Code는 유휴 상태에서도 일부 백그라운드 기능에 토큰을 사용합니다:
| 기능 | 설명 |
|---|---|
| 대화 요약 | claude --resume 기능을 위해 이전 대화 요약 |
| 명령어 처리 | /cost 같은 명령어가 상태 확인 요청 생성 |
버전 추적 및 변경사항
현재 버전 확인
claude doctor
이 명령어는 버전, 설치 유형, 시스템 정보를 표시합니다.
비용 보고 변경 시
claude doctor로 버전 확인- Claude에 현재 기능 동작에 대해 직접 질문 (최신 문서에 접근 가능)
- 청구 관련 질문은 Console 계정을 통해 Anthropic 지원팀에 문의
팀 배포 권장사항
| 단계 | 설명 |
|---|---|
| 1. 파일럿 | 소규모 파일럿 그룹으로 사용 패턴 파악 |
| 2. 모니터링 | 광범위 롤아웃 전 사용 패턴 모니터링 |
| 3. 조정 | 동시 사용 시나리오에 따라 TPM 할당 조정 |
| 4. 확장 | 높은 동시 사용(라이브 교육 세션 등)에는 높은 TPM 할당 요청 |
비용 트러블슈팅
비용이 예상보다 높을 때
비용이 예상보다 높게 나올 때 점검해볼 항목들이다:
| 증상 | 가능한 원인 | 해결 방법 |
|---|---|---|
| 단일 세션에서 급격한 비용 증가 | 대용량 파일 반복 분석 또는 긴 대화 | /compact로 컨텍스트 압축, 작업 분리 |
| 일별 비용이 $12 이상 지속 | 복잡한 작업 또는 대규모 코드베이스 | 쿼리를 구체적으로, 작업을 작은 단위로 분할 |
| 사용하지 않는데 비용 발생 | 백그라운드 프로세스 (요약 등) | 정상 동작 (세션당 ~$0.04 미만) |
| 팀 전체 비용 급증 | 동시 사용자 증가 또는 대규모 작업 | Console에서 사용자별 분석, 지출 한도 설정 |
비용 절감 체크리스트
- 컨텍스트가 커지기 전에
/compact정기적으로 사용 - 새 작업 시작 전
/clear로 히스토리 정리 - 모호한 질문보다 구체적인 질문 사용
- "전체 코드 분석해줘" 대신 특정 파일/함수 지정
- 대규모 리팩토링은 여러 세션으로 분리
- 자동 압축(auto-compact) 설정 활성화 확인
청구 관련 문의
청구서나 비용에 대해 질문이 있다면:
- Claude Console에서 상세 사용량 확인
claude doctor로 현재 버전 확인- Console 계정을 통해 Anthropic 지원팀에 문의
'AI > Claude Code Doc(공식문서) 번역본' 카테고리의 다른 글
당신이 좋아할만한 콘텐츠
-
Claude Code 공식문서 리뷰-Administration[8] : Claude Code 설정 - 플러그인 마켓플레이스(Create and distribute a plugin marketplace) 2026.01.04
-
Claude Code 공식문서 리뷰-Administration[7] : Claude Code 설정 - 분석(Analytics) 2026.01.04
-
Claude Code 공식문서 리뷰-Administration[5] : Claude Code 설정 - 모니터링(Monitoring) 2026.01.04
-
Claude Code 공식문서 리뷰-Administration[4] : Claude Code 설정 - 데이터 사용 2026.01.03
소중한 공감 감사합니다