Claude Code 공식문서 리뷰-Deployment[3] : Google Vertex AI의 Claude Code(Claude Code on Google Vertex AI)
- -
안녕하세요! 갓대희입니다.
Claude Code Docs 공식 문서 >> Deployment 섹션의 내용 중 [Google Vertex AI의 Claude Code]를 살펴 보려고 합니다.
이번 섹션 부터는 영문, 한글번역본이 모두 공식문서로 존재하는 섹션이니 한글 문서를 편하게 참고 하셔도 될 것 같습니다.
https://code.claude.com/docs/en/google-vertex-ai
Claude Code on Google Vertex AI - Claude Code Docs
Learn about configuring Claude Code through Google Vertex AI, including setup, IAM configuration, and troubleshooting.
code.claude.com
이 카테고리의 글은 편하게 공식 문서 위주의 내용을 눈으로 쭉 살펴 보고 넘어가는 목적을 갖고 시작 하게 되었습니다.
저도 초심으로 돌아가 기초적읜 글을 살펴보다보니, 지금와서 클로드에서 강조 하고자 하는 원칙이 어떤건지 되돌아볼 수 있는 계기가 되기도 하는 것 같아, 다른 분들도 꼭 한번 눈으로라도 이해 하고 넘어가는것이 좋다고 생각하여 공식 문서의 내용을 억지로 리뷰해보게 되었습니다.

회사에서 GCP 인프라를 쓰고 있다면, Claude Code를 Vertex AI로 연동하는 것이 가장 자연스러운 선택이다. 기존 GCP 계정, IAM 정책, 서비스 계정 인증을 그대로 활용할 수 있고, GCP 콘솔에서 비용과 사용량을 통합 관리할 수 있다.
GCP에서 제공하는 완전 관리형 AI 플랫폼이다. Claude를 포함한 여러 AI 모델을 GCP 인프라 내에서 사용할 수 있어서, 회사의 보안 정책을 그대로 적용할 수 있다.
- 회사에서 이미 GCP를 주력 클라우드로 사용 중
- Google Cloud IAM으로 팀 권한을 관리하고 있음
- GCP Billing으로 비용을 통합 관리하고 싶음
- VPC, 프라이빗 서브넷 등 GCP 보안 정책 준수 필요
- 1M 토큰 컨텍스트 윈도우가 필요함 (Vertex AI 베타 기능)
시작하기 전에 준비할 것들
걱정할 필요 없다. 대부분 GCP 사용자라면 이미 갖춰져 있을 항목들이다. 체크리스트처럼 하나씩 확인해 보자.
필수 항목- GCP 계정 - 결제가 활성화된 계정
-> GCP 콘솔에서 Vertex AI 메뉴가 보이면 OK - Claude 모델 접근 권한 - Model Garden에서 Claude Sonnet 4.5 또는 Haiku 4.5 사용 승인
-> 처음이라면 2단계에서 접근 요청 필요 (24-48시간 소요 가능) - Google Cloud SDK (gcloud) - 터미널에서 인증 설정에 필요
-> 터미널에서gcloud --version실행하면 확인 가능 - IAM 권한 - Vertex AI API를 호출할 수 있는 권한
-> 자세한 설정은 아래 "IAM 구성" 섹션 참고
- Cloud Shell - gcloud 로컬 설치 없이 브라우저에서 바로 사용 가능
- Workload Identity Federation - CI/CD 환경에서 키 없이 인증
리전 구성 - 어떤 리전을 선택해야 할까?
모든 리전에서 Claude 모델을 쓸 수 있는 것이 아니다. 특히 글로벌 엔드포인트와 리전 엔드포인트의 차이를 알아두어야 한다.
글로벌 엔드포인트CLOUD_ML_REGION=global |
장점: 여러 리전에서 자동 라우팅, 안정성 높음 단점: 일부 모델(예: Haiku 3.5) 미지원 권장: 대부분의 경우 이 설정으로 시작 |
리전 엔드포인트CLOUD_ML_REGION=us-east5 |
장점: 특정 모델 사용 가능, 데이터 지역 요구사항 충족 단점: 해당 리전 할당량에 영향 받음 권장: 글로벌 엔드포인트에서 미지원 모델 사용 시 |
글로벌 엔드포인트를 기본으로 쓰면서, 특정 모델만 리전 엔드포인트를 사용할 수 있다:
export CLOUD_ML_REGION=global
export VERTEX_REGION_CLAUDE_3_5_HAIKU=us-east5
설정 프로세스
1단계: Vertex AI API 활성화
처음 GCP에서 Vertex AI를 쓰는가?
GCP 프로젝트에서 Vertex AI API를 활성화해야 한다. 한 번만 하면 된다.
- 프로젝트 ID 설정
gcloud config set project YOUR-PROJECT-ID - Vertex AI API 활성화
gcloud services enable aiplatform.googleapis.com
gcloud services list --enabled | grep aiplatform
-> 결과가 나오면 이미 활성화된 것이다.
2단계: Model Garden에서 모델 접근 요청
Claude 모델은 Model Garden에서 접근 요청을 해야 한다. 승인까지 24-48시간이 걸릴 수 있으니 미리 신청해두자.
진행 순서- GCP 콘솔에서 Vertex AI Model Garden 이동
-> 검색창에 "Model Garden" 입력 - "Claude" 검색
-> Anthropic의 Claude 모델들이 표시된다 - 원하는 모델 선택 후 "Enable" 클릭
-> Claude Sonnet 4.5 권장 (기본 모델로 사용됨) - 사용 사례 양식 작성
-> "개발 도구로 사용", "코드 작성 지원" 등 실제 사용 목적을 적으면 된다
상세한 사용 목적을 작성하면 승인이 빨라질 수 있다. "Claude Code CLI 도구를 통한 개발 생산성 향상" 같이 구체적으로 적어보자.
3단계: GCP 자격 증명 구성 - 나에게 맞는 방법 선택하기
Claude Code는 Google Cloud 표준 인증 체인을 사용한다. 각자의 상황에 맞는 방법을 아래에서 선택하자.
개인 개발자이거나 이미 로컬에서 gcloud를 쓰고 있다면 가장 간단한 방법이다.
# 애플리케이션 기본 자격 증명 설정
gcloud auth application-default login
-> 브라우저가 열리고 Google 계정으로 로그인하면 자격 증명이 저장된다.
CI/CD 환경이나 자동화된 워크플로우에서 사용할 때 적합하다.
# 서비스 계정 키 파일 경로 설정
export GOOGLE_APPLICATION_CREDENTIALS="/path/to/service-account-key.json"
보안 팁: 서비스 계정 키는 Git에 커밋하지 말자. Secret Manager 사용을 권장한다.
Workload Identity Federation을 사용하면 서비스 계정 키 없이 인증할 수 있다.
- uses: google-github-actions/auth@v2
with:
workload_identity_provider: 'projects/123456/locations/global/workloadIdentityPools/my-pool/providers/my-provider'
service_account: 'my-service-account@my-project.iam.gserviceaccount.com'
Cloud Shell을 사용하면 인증 설정 없이 바로 테스트할 수 있다.
- GCP 콘솔에서 Cloud Shell 아이콘 클릭
- Claude Code 설치:
npm install -g @anthropic-ai/claude-code - 환경 변수 설정 후 바로 사용
-> Cloud Shell은 이미 gcloud 인증이 되어 있어서 추가 설정이 필요 없다.
4단계: Claude Code가 Vertex AI를 쓰도록 설정
Claude Code는 기본적으로 Anthropic API를 직접 호출한다. Vertex AI를 사용하려면 "Vertex AI를 통해 호출하라"고 명시적으로 알려줘야 한다.
셸 설정 파일(~/.zshrc 또는 ~/.bashrc)에 다음을 추가하자:
# Vertex AI 통합 활성화 (필수)
export CLAUDE_CODE_USE_VERTEX=1
# 리전 설정 (필수)
export CLOUD_ML_REGION=global
# GCP 프로젝트 ID (필수)
export ANTHROPIC_VERTEX_PROJECT_ID=YOUR-PROJECT-ID
# 선택: 글로벌 엔드포인트에서 미지원 모델용 리전 재정의
export VERTEX_REGION_CLAUDE_3_5_HAIKU=us-east5
CLAUDE_CODE_USE_VERTEX=1 |
Claude Code에게 "Vertex AI API를 써라"고 알려준다 |
CLOUD_ML_REGION=global |
어느 리전의 Vertex AI를 쓸지 지정. global 권장 |
ANTHROPIC_VERTEX_PROJECT_ID |
Vertex AI가 활성화된 GCP 프로젝트 ID |
VERTEX_REGION_* |
특정 모델만 다른 리전에서 사용할 때 (선택 사항) |
- Vertex AI 사용 시 Claude Code의
/login,/logout명령은 비활성화된다
-> Google Cloud 인증 방식으로만 로그인하기 때문 - 프로젝트 ID는
GCLOUD_PROJECT,GOOGLE_CLOUD_PROJECT로도 재정의 가능하다
5단계: 모델 구성 - 작업에 맞는 모델 선택하기
Claude Code는 상황에 따라 두 가지 모델을 자동으로 전환한다. 직접 선택할 필요는 없지만, 어떻게 동작하는지 알아두면 유용하다.
| Sonnet 4.5 기본 모델 (복잡한 작업) |
언제 사용? 코드 작성, 리팩토링, 복잡한 분석 기본값: claude-sonnet-4-5@20250929 |
| Haiku 4.5 소형/빠른 모델 (빠른 작업) |
언제 사용? 파일 탐색, 간단한 검색, 빠른 응답 필요 시 기본값: claude-haiku-4-5@20251001 |
- Sonnet 사용: "이 함수를 리팩토링해줘", "새로운 API 엔드포인트를 만들어줘"
- Haiku 사용: "이 에러 메시지를 찾아줘", "프로젝트 구조를 보여줘"
커스터마이징: 필요시 모델 변경하기
하지만 다음과 같은 경우 모델을 직접 지정할 수 있다:
- 특정 버전의 모델을 고정하고 싶을 때
- 비용 절감을 위해 항상 Haiku를 쓰고 싶을 때
- 최신 모델(예: Opus 4.1)을 사용하고 싶을 때
# 커스텀 모델 구성
export ANTHROPIC_MODEL='claude-opus-4-1@20250805'
export ANTHROPIC_SMALL_FAST_MODEL='claude-haiku-4-5@20251001'
# 선택: 프롬프트 캐싱 비활성화 (캐싱 비용을 피하고 싶을 때)
export DISABLE_PROMPT_CACHING=1
Claude Code는 Haiku 3.5에서 4.5로 자동 업그레이드하지 않는다. 수동으로 업그레이드하려면 다음을 설정하자:
export ANTHROPIC_DEFAULT_HAIKU_MODEL='claude-haiku-4-5@20251001'
1M 토큰 컨텍스트 윈도우 - Vertex AI의 특별 기능
Claude Sonnet 4 및 Sonnet 4.5는 Vertex AI에서 1M (100만) 토큰 컨텍스트 윈도우를 지원한다. 이는 대규모 코드베이스 전체를 한 번에 분석할 수 있다는 의미다.
- 대규모 코드베이스 분석: 수천 개 파일로 구성된 프로젝트 전체를 컨텍스트에 넣고 분석
- 긴 대화 유지: 복잡한 리팩토링 작업을 여러 단계에 걸쳐 진행하면서 맥락 유지
- 문서 전체 참조: 긴 기술 문서나 스펙을 전부 참조하면서 작업
확장된 컨텍스트를 사용하려면 Vertex AI 요청에 베타 헤더를 포함해야 한다:
context-1m-2025-08-07
- 현재 베타 상태이며, 정식 출시 전 변경될 수 있다
- 긴 컨텍스트는 비용이 증가할 수 있다 (토큰당 과금)
- 모든 리전에서 지원되지 않을 수 있다 - 글로벌 엔드포인트 권장
IAM 권한 설정 - Claude Code가 Vertex AI에 접근하려면?
Claude Code가 Vertex AI API를 호출하려면 "이 계정/서비스 계정이 Vertex AI를 쓸 권한이 있다"는 것을 GCP에 증명해야 한다. IAM 역할이 바로 이 권한을 정의하는 것이다.
| 역할 | 설명 |
|---|---|
roles/aiplatform.user |
Vertex AI 모델 호출 및 예측에 필요한 기본 역할 |
포함된 권한:
aiplatform.endpoints.predict- 모델 호출 및 토큰 계산에 필요
역할 부여 방법
# 사용자에게 역할 부여
gcloud projects add-iam-policy-binding YOUR-PROJECT-ID \
--member="user:your-email@example.com" \
--role="roles/aiplatform.user"
# 서비스 계정에 역할 부여
gcloud projects add-iam-policy-binding YOUR-PROJECT-ID \
--member="serviceAccount:your-sa@YOUR-PROJECT-ID.iam.gserviceaccount.com" \
--role="roles/aiplatform.user"
더 제한적인 접근을 위해 필요한 권한만 포함된 커스텀 역할을 생성할 수 있다. aiplatform.endpoints.predict 권한만 있으면 Claude Code는 동작한다.
Claude Code용 GCP 프로젝트를 별도로 만들면 이런 장점이 있다:
- 비용 추적: Claude Code 비용만 따로 확인 가능
- 보안 격리: 다른 GCP 리소스와 분리되어 더 안전
- 권한 관리: Vertex AI만 접근 가능하도록 최소 권한 적용
문제 해결 - 자주 겪는 문제와 해결 방법
대부분의 Vertex AI 연동 문제는 리전 설정, 모델 접근 권한, 또는 인증 문제다. 아래 체크리스트를 순서대로 확인해 보자.
문제 1: "Model not found" 404 에러
- "Could not find model..." 에러 발생
- "Model not available in this region" 메시지
- Claude Code가 시작은 되는데 응답이 안 옴
1. Model Garden에서 모델이 활성화되지 않음
2. 해당 리전에서 모델을 지원하지 않음
3. 글로벌 엔드포인트에서 미지원 모델 사용 시도
- Model Garden에서 모델 활성화 확인
-> GCP 콘솔 -> Vertex AI -> Model Garden -> Claude 검색 -> Enable 확인 - 리전 지원 여부 확인
-> Model Garden의 "Supported features"에서 글로벌 엔드포인트 지원 여부 확인 - 글로벌 엔드포인트 미지원 시 리전 재정의
export VERTEX_REGION_CLAUDE_3_5_HAIKU=us-east5
문제 2: 429 요청 한도 에러
- "Too many requests" 에러
- "Resource exhausted" 메시지
해당 리전의 할당량(Quota)을 초과했다.
해결 방법- 현재 할당량 확인
-> GCP 콘솔 -> IAM & Admin -> Quotas -> "aiplatform" 검색 - 할당량 증가 요청
-> Google Cloud 지원팀에 문의하여 할당량 증가 요청 - 글로벌 엔드포인트로 전환 고려
-> 글로벌 엔드포인트는 여러 리전에서 자동 라우팅되어 가용성이 높다export CLOUD_ML_REGION=global
문제 3: 인증 에러 / Permission Denied
- "Permission denied" 에러
- "Request had insufficient authentication scopes"
- "Unauthenticated" 메시지
- gcloud 인증 재설정
gcloud auth application-default login - IAM 역할 확인
->roles/aiplatform.user역할이 부여되어 있는지 확인 - 프로젝트 ID 확인
->ANTHROPIC_VERTEX_PROJECT_ID가 올바른지 확인
프롬프트 캐싱 관련
반복되는 프롬프트를 캐싱하여 비용을 절감하는 기능이다. cache_control 임시 플래그 지정 시 자동 지원된다.
캐싱 비활성화가 필요한 경우:
- 일부 리전에서 캐싱이 지원되지 않는 경우
- 캐싱 관련 에러가 발생하는 경우
export DISABLE_PROMPT_CACHING=1
더 알아보기 - 유용한 자료 모음
설정 중 막히거나, 더 깊이 알고 싶을 때 참고할 수 있는 공식 문서들이다.
| 리소스 | 언제 유용한가? |
|---|---|
| Vertex AI 문서 Google Cloud 공식 가이드 |
이럴 때 보자: - Vertex AI가 처음이라 전반적으로 이해하고 싶을 때 - 모델 목록과 각 모델의 성능 비교가 필요할 때 - 보안 설정, VPC 연동 등 심화 내용을 알고 싶을 때 |
| Vertex AI 가격 요금 계산기 |
이럴 때 보자: - Claude Code 도입 전 예상 비용을 계산하고 싶을 때 - Sonnet vs Haiku 비용 차이를 비교하고 싶을 때 - 프롬프트 캐싱 사용 시 비용 절감 효과를 확인하고 싶을 때 |
| Vertex AI 할당량 할당량 관리 가이드 |
이럴 때 보자: - 429 에러가 자주 발생할 때 - 팀에서 동시에 많이 사용할 때 할당량 증가 필요 - 각 리전별 할당량 제한을 확인하고 싶을 때 |
- Google Cloud Support: Vertex AI 관련 기술 문제는 Google Cloud Support 티켓으로 문의
-> 리전 이슈, IAM 권한 문제, 할당량 증가 요청 등 - Claude Code GitHub: Claude Code 자체의 버그나 기능 요청
-> https://github.com/anthropics/claude-code
핵심 요약 - 설정 체크리스트
아래 항목들이 제대로 설정되어 있다면 Claude Code를 Vertex AI에서 사용할 준비가 완료된 것이다.
| 항목 | 설정 내용 |
|---|---|
| Vertex AI 활성화 | export CLAUDE_CODE_USE_VERTEX=1-> ~/.zshrc 또는 ~/.bashrc에 추가 |
| 리전 설정 | export CLOUD_ML_REGION=global-> 글로벌 엔드포인트 권장 |
| 프로젝트 ID | export ANTHROPIC_VERTEX_PROJECT_ID=YOUR-PROJECT-ID |
| GCP 인증 | 다음 중 하나 선택: - gcloud auth application-default login - 서비스 계정 키 (GOOGLE_APPLICATION_CREDENTIALS) - Workload Identity Federation |
| 기본 모델 | - Sonnet 4.5: 복잡한 코딩 작업 - Haiku 4.5: 빠른 검색/탐색 -> 자동 선택되므로 별도 설정 불필요 |
| IAM 권한 | roles/aiplatform.user-> aiplatform.endpoints.predict 권한 포함 |
| 특별 기능 | 1M 토큰 컨텍스트 윈도우 (베타) -> Vertex AI의 차별화 포인트 |
모든 설정이 완료되었다면 터미널을 재시작하고 Claude Code를 실행해 보자.
# 터미널 재시작 후
source ~/.zshrc # 또는 source ~/.bashrc
# Claude Code 실행
claude
# 또는
claude "간단한 Python 함수를 작성해줘"
-> 정상적으로 응답이 오면 성공
-> 에러가 발생하면 위 "문제 해결" 섹션을 참고하자.
기존 GCP 인프라와의 통합, IAM 권한 관리, 비용 통합 추적, 그리고 1M 토큰 컨텍스트 윈도우까지.
GCP 사용자라면 Vertex AI가 최적의 선택일 것 이다.
'AI > Claude Code Doc(공식문서) 번역본' 카테고리의 다른 글
당신이 좋아할만한 콘텐츠
-
Claude Code 공식문서 리뷰-Deployment[5] : 기업 네트워크 구성(Enterprise network configuration) 2026.01.01
-
Claude Code 공식문서 리뷰-Deployment[4] : Microsoft Foundry의 Claude Code 2026.01.01
-
Claude Code 공식문서 리뷰-Deployment[1] : 엔터프라이즈 배포 개요(Enterprise deployment overview) 2025.12.29
-
Claude Code 공식문서 리뷰-Build with Claude Code[8] : Troubleshooting 2025.12.29
소중한 공감 감사합니다