새소식

300x250
AI/Claude Code Doc(공식문서) 번역본

Claude Code 공식문서 리뷰-Administration[6] : Claude Code 설정 - 비용을 효과적으로 관리하기(Manage costs effectively)

  • -
728x90

안녕하세요! 갓대희입니다. 

Claude Code Docs 공식 문서 >> [관리] 섹션의 내용 중 [Claude Code 설정 - 비용을 효과적으로 관리하기(Manage costs effectively)]를 살펴 보려고 합니다.

이번 섹션 부터는 영문, 한글번역본이 모두 공식문서로 존재하는 섹션이니 한글 문서를 편하게 참고 하셔도 될 것 같습니다.

https://code.claude.com/docs/ko/costs

 

비용을 효과적으로 관리하기 - Claude Code Docs

Claude Code 사용 시 토큰 사용량과 비용을 추적하고 최적화하는 방법을 알아봅니다.

code.claude.com

 

이 카테고리의 글은 편하게 공식 문서 위주의 내용을 눈으로 쭉 살펴 보고 넘어가는 목적을 갖고 시작 하게 되었습니다.

저도 초심으로 돌아가 기초적읜 글을 살펴보다보니, 지금와서 클로드에서 강조 하고자 하는 원칙이 어떤건지 되돌아볼 수 있는 계기가 되기도 하는 것 같아, 다른 분들도 꼭 한번 눈으로라도 이해 하고 넘어가는것이 좋다고 생각하여 공식 문서의 내용을 억지로 리뷰해보게 되었습니다.

 

 

Claude Code 비용

비용 구조, 추적 방법, 최적화 전략

토큰이란?

Claude API와의 모든 상호작용은 토큰을 소비한다. 토큰은 텍스트의 기본 단위로, 대략 4글자(영어 기준) 또는 3/4 단어에 해당한다.

토큰 사용량 실제 예시

개발 작업에서 토큰이 어떻게 소비되는지 감을 잡아보자:

작업 유형 예상 토큰 비고
"Hello World" 문자열 ~3 토큰 가장 간단한 예시
100줄 Python 코드 500-800 토큰 코드 복잡도에 따라 다름
대화 한 턴 (질문 + 응답) 1,000-3,000 토큰 평균적인 상호작용
중간 규모 파일 분석 5,000-10,000 토큰 파일 읽기 + 분석 + 응답
한글은 토큰을 더 많이 소비한다

영어는 대략 4글자 = 1토큰이지만, 한글은 1-2글자 = 1토큰 정도로 더 많은 토큰을 사용한다. 한글로 작업할 때는 비용이 조금 더 높아질 수 있다.

 

개요

Claude Code의 비용 구조:

항목 비용
평균 비용 개발자당 일 $6
90번째 백분위 90%의 사용자가 일 $12 미만
월간 추정 개발자당 월 ~$100-200 (Sonnet 4.5 기준)
참고: 월간 비용은 사용 패턴에 따라 크게 달라질 수 있다.

모델별 비용 차이

Claude Code는 작업 특성에 따라 두 가지 모델을 자동 선택한다. 각 모델의 비용 특성을 이해하면 비용 최적화에 도움이 된다:

모델 사용 상황 비용 특성
Sonnet 4.5 코드 작성, 리팩토링, 복잡한 분석 토큰당 비용 높음 (고성능)
Haiku 4.5 파일 탐색, 간단한 검색, 빠른 응답 토큰당 비용 낮음 (경량)
자동 선택이므로 직접 관리할 필요 없다

Claude Code가 작업 복잡도에 따라 적절한 모델을 자동 선택한다. 복잡한 코딩 작업에는 Sonnet을, 파일 검색 같은 간단한 작업에는 Haiku를 사용한다.

작업별 예상 비용

실제 개발 시나리오별 예상 비용이다. 작업 복잡도와 코드베이스 크기에 따라 달라질 수 있다:

작업 시나리오 소요 시간 예상 비용
간단한 버그 수정 30분 $0.50-1.00
코드 리뷰 및 피드백 1시간 $1.00-2.00
새 기능 구현 2-3시간 $2.00-4.00
대규모 리팩토링 반나절 $3.00-6.00
추정치 주의: 위 비용은 일반적인 사용 패턴 기반 추정이다. 대규모 코드베이스 분석이나 긴 대화 컨텍스트는 비용이 더 높아질 수 있다.

 

비용 추적

/cost 명령어

/cost 명령어로 현재 세션의 상세 토큰 사용 통계를 확인할 수 있습니다:

Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed
참고: /cost 명령어는 Claude Max 및 Pro 구독자를 위한 것이 아닙니다.

 

Claude Console에서 비용 확인하기

과거 사용량과 상세 비용 내역은 Claude Console에서 확인할 수 있다:

Console 접근 경로
  1. console.anthropic.com 접속
  2. 좌측 메뉴에서 Usage 클릭
  3. 기간별, 워크스페이스별 사용량 확인
메뉴 확인 가능 정보 필요 권한
Usage 일별/월별 토큰 사용량, 비용 추이 그래프 Admin, Billing
Billing 청구서, 결제 내역, 지출 한도 설정 Admin
Workspaces 워크스페이스별 사용량 분리 확인 Admin
자동 생성되는 워크스페이스

Claude Code를 처음 인증하면 "Claude Code"라는 워크스페이스가 자동 생성된다. 이 워크스페이스는 Claude Code 전용이며, API 키를 생성할 수 없다.

 

지출 한도 설정

예상치 못한 비용 초과를 방지하려면 워크스페이스 지출 한도를 설정하자:

지출 한도 설정 방법
  1. Claude Console 접속
  2. Settings > Spend limits 이동
  3. 월간 또는 일간 한도 금액 입력
  4. 한도 도달 시 알림 또는 차단 설정 선택
팀 운영 팁: 팀 규모에 따라 월간 한도를 (팀원 수 x $200) 정도로 설정하고, 실제 사용량을 보며 조정하는 것을 권장한다.

 

팀 비용 관리

API 비용 관리

Claude API를 사용할 때 Claude Console을 통해 Claude Code 워크스페이스의 총 지출을 제한할 수 있습니다.

클라우드 제공자 추적 (Bedrock & Vertex)

Claude Code는 클라우드 배포에서 메트릭을 전송하지 않습니다. 대규모 엔터프라이즈 배포의 비용 메트릭은 LiteLLM을 고려할 수 있습니다.

보안 주의:

LiteLLM은 Anthropic과 제휴되지 않은 서드파티 도구이며, Anthropic에서 보안 감사를 수행하지 않았다. 프로덕션 환경에서 사용 전에 자체 보안 검토를 수행하는 것을 권장한다.

권장 레이트 리밋

조직 규모에 따른 사용자당 권장 TPM (분당 토큰) 및 RPM (분당 요청):

팀 규모 사용자당 TPM 사용자당 RPM
1-5명 200k-300k 5-7
5-20명 100k-150k 2.5-3.5
20-50명 50k-75k 1.25-1.75
50-100명 25k-35k 0.62-0.87
100-500명 15k-20k 0.37-0.47
500명+ 10k-15k 0.25-0.35

예시: 200명 x 20k TPM = 총 4백만 TPM

실전 팁: 이 제한은 조직 수준에서 적용되므로, 다른 사용자가 활발히 사용하지 않을 때 개별 사용자가 일시적으로 할당량을 초과할 수 있습니다.

 

토큰 사용량 줄이기

대화 압축

기능 설명
자동 압축 컨텍스트가 95% 용량을 초과하면 기본적으로 활성화
토글 /config > "Auto-compact enabled" 설정
수동 압축 컨텍스트가 커지면 /compact 명령어 사용
커스텀 지침 /compact 코드 샘플과 API 사용에 집중해

CLAUDE.md 설정 예시:

# Summary instructions

When you are using compact, please focus on test output and code changes

 

/compact 실제 사용 예시

대화가 길어져 컨텍스트가 커졌을 때 /compact 명령어를 사용하면 이런 결과를 볼 수 있다:

> /compact

Compacting conversation...
Before: 45,231 tokens
After:  12,847 tokens
Saved:  32,384 tokens (71%)

특정 내용에 집중하도록 지시할 수도 있다:

> /compact 에러 해결 과정과 최종 코드 변경사항만 유지해줘

Compacting with custom instructions...
Before: 52,000 tokens
After:  8,234 tokens
Saved:  43,766 tokens (84%)
압축 타이밍 팁

컨텍스트가 70-80% 정도 찼을 때 수동으로 압축하면 더 효과적이다. 95%에서 자동 압축되기를 기다리면 이미 많은 토큰을 소비한 후다.

 

비용 최적화 전략

  1. 구체적인 쿼리 작성: 불필요한 스캔을 유발하는 모호한 요청 피하기
  2. 복잡한 작업 분할: 큰 작업을 집중된 상호작용으로 나누기
  3. 작업 간 히스토리 정리: /clear로 컨텍스트 초기화

 

비용 변동 요인

요인 영향
분석 중인 코드베이스 크기 클수록 비용 증가
쿼리 복잡성 복잡할수록 비용 증가
검색/수정 파일 수 많을수록 비용 증가
대화 기록 길이 길수록 비용 증가
대화 압축 빈도 자주 압축하면 비용 감소

 

백그라운드 토큰 사용

Claude Code는 유휴 상태에서도 일부 백그라운드 기능에 토큰을 사용합니다:

기능 설명
대화 요약 claude --resume 기능을 위해 이전 대화 요약
명령어 처리 /cost 같은 명령어가 상태 확인 요청 생성
참고: 이러한 백그라운드 프로세스는 일반적으로 세션당 $0.04 미만을 소비합니다.

 

버전 추적 및 변경사항

현재 버전 확인

claude doctor

이 명령어는 버전, 설치 유형, 시스템 정보를 표시합니다.

비용 보고 변경 시

  1. claude doctor로 버전 확인
  2. Claude에 현재 기능 동작에 대해 직접 질문 (최신 문서에 접근 가능)
  3. 청구 관련 질문은 Console 계정을 통해 Anthropic 지원팀에 문의

 

팀 배포 권장사항

단계 설명
1. 파일럿 소규모 파일럿 그룹으로 사용 패턴 파악
2. 모니터링 광범위 롤아웃 전 사용 패턴 모니터링
3. 조정 동시 사용 시나리오에 따라 TPM 할당 조정
4. 확장 높은 동시 사용(라이브 교육 세션 등)에는 높은 TPM 할당 요청

 

비용 트러블슈팅

비용이 예상보다 높을 때

비용이 예상보다 높게 나올 때 점검해볼 항목들이다:

증상 가능한 원인 해결 방법
단일 세션에서 급격한 비용 증가 대용량 파일 반복 분석 또는 긴 대화 /compact로 컨텍스트 압축, 작업 분리
일별 비용이 $12 이상 지속 복잡한 작업 또는 대규모 코드베이스 쿼리를 구체적으로, 작업을 작은 단위로 분할
사용하지 않는데 비용 발생 백그라운드 프로세스 (요약 등) 정상 동작 (세션당 ~$0.04 미만)
팀 전체 비용 급증 동시 사용자 증가 또는 대규모 작업 Console에서 사용자별 분석, 지출 한도 설정

 

비용 절감 체크리스트

  • 컨텍스트가 커지기 전에 /compact 정기적으로 사용
  • 새 작업 시작 전 /clear로 히스토리 정리
  • 모호한 질문보다 구체적인 질문 사용
  • "전체 코드 분석해줘" 대신 특정 파일/함수 지정
  • 대규모 리팩토링은 여러 세션으로 분리
  • 자동 압축(auto-compact) 설정 활성화 확인

 

청구 관련 문의

청구서나 비용에 대해 질문이 있다면:

  1. Claude Console에서 상세 사용량 확인
  2. claude doctor로 현재 버전 확인
  3. Console 계정을 통해 Anthropic 지원팀에 문의
300x250
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.

💡 AI 관련 질문이 있나요? 눌러보세요!