분류 전체보기
-
안녕하세요! 갓대희 입니다.AI 에이전트 개발자라면 한 번쯤 마주치는 딜레마가 있다. 성능이 필요하면 Opus, 비용이 걱정되면 Haiku나 Sonnet — 이 둘 중 하나를 골라야 했다. Anthropic이 2026년 초 이 이분법을 깨는 패턴을 공식 API로 내놨다. 이름은 Advisor Strategy다. 핵심 아이디어는 단순하다. 빠른 모델(executor)이 작업을 진행하다 복잡한 판단이 필요한 순간에만 Opus(advisor)에게 묻는다. Opus는 도구도 실행하지 않고, 짧은 계획만 전달한다. executor는 그 조언을 받아 재개한다.이 글에서는 두 가지를 다룬다. 하나는 공식 Advisor Tool API — Python SDK와 TypeScript SDK, curl로 바로 붙일 수 있는..
Claude API 신기능 : Advisor Strategy(어드바이저 전략) - 비용은 낮추고 성능은 올리는 Advisor Tool API안녕하세요! 갓대희 입니다.AI 에이전트 개발자라면 한 번쯤 마주치는 딜레마가 있다. 성능이 필요하면 Opus, 비용이 걱정되면 Haiku나 Sonnet — 이 둘 중 하나를 골라야 했다. Anthropic이 2026년 초 이 이분법을 깨는 패턴을 공식 API로 내놨다. 이름은 Advisor Strategy다. 핵심 아이디어는 단순하다. 빠른 모델(executor)이 작업을 진행하다 복잡한 판단이 필요한 순간에만 Opus(advisor)에게 묻는다. Opus는 도구도 실행하지 않고, 짧은 계획만 전달한다. executor는 그 조언을 받아 재개한다.이 글에서는 두 가지를 다룬다. 하나는 공식 Advisor Tool API — Python SDK와 TypeScript SDK, curl로 바로 붙일 수 있는..
2026.04.26 -
안녕하세요! 갓대희 입니다. AI가 코드를 쓰는 속도가 빨라질수록 리뷰하는 속도는 따라가지 못했다. Anthropic 내부 데이터에 따르면 엔지니어 1인당 코드 산출량이 지난 1년간 200% 증가했고, 코드 리뷰가 새로운 병목이 됐다. 이 문제를 해결하기 위해 Anthropic이 선택한 답이 /ultrareview다. /ultrareview는 원격 클라우드 샌드박스에서 에이전트 플릿이 병렬로 버그를 탐색하고, 별도 검증 단계에서 거짓 양성을 걸러낸 뒤 결과를 세션에 알림으로 돌려주는 멀티 에이전트 코드 리뷰 파이프라인이다. 이 글은 /ultrareview가 무엇인지, 어떻게 작동하는지, 기존 /review·Skill 기반 리뷰와 무엇이 다른지 공식 문서 기반으로 분석해보고자 한다.목차/ultrarevie..
Claude Code 'ultrareview'란 : 멀티 에이전트 코드 리뷰, 어떻게 작동하나 - 회당 $5~$20 추가 과금은 합리적 일까안녕하세요! 갓대희 입니다. AI가 코드를 쓰는 속도가 빨라질수록 리뷰하는 속도는 따라가지 못했다. Anthropic 내부 데이터에 따르면 엔지니어 1인당 코드 산출량이 지난 1년간 200% 증가했고, 코드 리뷰가 새로운 병목이 됐다. 이 문제를 해결하기 위해 Anthropic이 선택한 답이 /ultrareview다. /ultrareview는 원격 클라우드 샌드박스에서 에이전트 플릿이 병렬로 버그를 탐색하고, 별도 검증 단계에서 거짓 양성을 걸러낸 뒤 결과를 세션에 알림으로 돌려주는 멀티 에이전트 코드 리뷰 파이프라인이다. 이 글은 /ultrareview가 무엇인지, 어떻게 작동하는지, 기존 /review·Skill 기반 리뷰와 무엇이 다른지 공식 문서 기반으로 분석해보고자 한다.목차/ultrarevie..
2026.04.24 -
안녕하세요! 갓대희 입니다.6주마다 새 모델이 나오는 시대다. GPT-5.4 출시 6주 만인 2026년 4월 23일, OpenAI는 GPT-5.5를 공개했다.Fortune은 이를 두고 "AI 모델 출시가 소프트웨어 업데이트처럼 보이기 시작했다"고 평했다. (Fortune, 2026-04-23)그러나 이번 릴리즈는 단순한 버전 숫자 올림이 아니다. GPT-5.5는 에이전틱 AI, 즉 스스로 계획하고 도구를 사용해 장시간 작업을 완수하는 AI로의 전환을 선언한다. 동시에 API 가격은 전작 대비 2배로 올랐고, 독립 기관의 환각률 측정에서는 업계 최고 수준의 부담스러운 수치를 기록했다. 이 글에서는 공식 발표와 벤치마크 데이터를 기반으로 GPT-5.5의 성능·가격·한계·경쟁 모델 비교를 정리했다. 여기에 더..
OpenAI GPT-5.5 리뷰 : 에이전틱 AI의 새 기준인가, 가격 2배 인상의 정당화인가 - 벤치마크부터 환각률까지안녕하세요! 갓대희 입니다.6주마다 새 모델이 나오는 시대다. GPT-5.4 출시 6주 만인 2026년 4월 23일, OpenAI는 GPT-5.5를 공개했다.Fortune은 이를 두고 "AI 모델 출시가 소프트웨어 업데이트처럼 보이기 시작했다"고 평했다. (Fortune, 2026-04-23)그러나 이번 릴리즈는 단순한 버전 숫자 올림이 아니다. GPT-5.5는 에이전틱 AI, 즉 스스로 계획하고 도구를 사용해 장시간 작업을 완수하는 AI로의 전환을 선언한다. 동시에 API 가격은 전작 대비 2배로 올랐고, 독립 기관의 환각률 측정에서는 업계 최고 수준의 부담스러운 수치를 기록했다. 이 글에서는 공식 발표와 벤치마크 데이터를 기반으로 GPT-5.5의 성능·가격·한계·경쟁 모델 비교를 정리했다. 여기에 더..
2026.04.24 -
안녕하세요! 갓대희 입니다.Anthropic Labs가 2026-04-17 공개한 Claude Design은 텍스트 프롬프트 한 줄에서 인터랙티브 프로토타입까지 직접 생성하는 도구이다. 접근 URL은 claude.ai/design이고 Pro/Max/Team/Enterprise 구독자에게 제공된다.공식 문서(Help Center, Design System 문서, Pricing 문서)와 커뮤니티 리뷰를 직접 읽어 각 기능을 단계별로 정리한 것이다.Claude Design은 Anthropic Labs의 research preview로, 기능·사용량 한도·내보내기 옵션은 공식 발표 이후에도 변경될 수 있다. 실제 사용 전 공식 발표 페이지와 Help Center에서 최신 상태를 다시 확인하자.목차출시 배경과 포..
Claude Code 'Claude Design이란?' 리뷰(1) : Figma 대체재인가, 보완재인가 - 디자인 시스템 설정부터 Claude Code 핸드오프까지안녕하세요! 갓대희 입니다.Anthropic Labs가 2026-04-17 공개한 Claude Design은 텍스트 프롬프트 한 줄에서 인터랙티브 프로토타입까지 직접 생성하는 도구이다. 접근 URL은 claude.ai/design이고 Pro/Max/Team/Enterprise 구독자에게 제공된다.공식 문서(Help Center, Design System 문서, Pricing 문서)와 커뮤니티 리뷰를 직접 읽어 각 기능을 단계별로 정리한 것이다.Claude Design은 Anthropic Labs의 research preview로, 기능·사용량 한도·내보내기 옵션은 공식 발표 이후에도 변경될 수 있다. 실제 사용 전 공식 발표 페이지와 Help Center에서 최신 상태를 다시 확인하자.목차출시 배경과 포..
2026.04.23 -
안녕하세요! 갓대희 입니다. AI 코딩 에이전트에게 "Stripe 스타일로 만들어줘"라고 지시해본 적이 있는데 매번 결과물이 들쭉날쭉하다면, 그 원인은 에이전트가 디자인 의도를 읽을 공통 언어가 없기 때문이다.Google Stitch는 이 문제를 해결하기 위해 DESIGN.md라는 개념을 도입했다.마크다운 파일 한 장으로 컬러 팔레트부터 타이포그래피, 컴포넌트 스타일까지 명시해두면, AI 에이전트가 코드를 생성할 때마다 이 파일을 먼저 읽어 일관된 외관을 유지한다.목차DESIGN.md란 무엇인가 — README.md와 무엇이 다른가왜 DESIGN.md가 필요한가 — AI UI의 랜덤성 문제DESIGN.md 포맷 상세 — 9개 섹션 구조awesome-design-md 레포지토리 소개DESIGN.md 접근 ..
DESIGN.md : Google Stitch가 도입한 DESIGN.md - DESIGN.md 도입 배경부터 적용해보기(VoltAgent awesome-design-md 컬렉션 활용 가이드)안녕하세요! 갓대희 입니다. AI 코딩 에이전트에게 "Stripe 스타일로 만들어줘"라고 지시해본 적이 있는데 매번 결과물이 들쭉날쭉하다면, 그 원인은 에이전트가 디자인 의도를 읽을 공통 언어가 없기 때문이다.Google Stitch는 이 문제를 해결하기 위해 DESIGN.md라는 개념을 도입했다.마크다운 파일 한 장으로 컬러 팔레트부터 타이포그래피, 컴포넌트 스타일까지 명시해두면, AI 에이전트가 코드를 생성할 때마다 이 파일을 먼저 읽어 일관된 외관을 유지한다.목차DESIGN.md란 무엇인가 — README.md와 무엇이 다른가왜 DESIGN.md가 필요한가 — AI UI의 랜덤성 문제DESIGN.md 포맷 상세 — 9개 섹션 구조awesome-design-md 레포지토리 소개DESIGN.md 접근 ..
2026.04.23 -
안녕하세요! 갓대희 입니다. AI 코딩 에이전트를 쓰다 보면 비슷한 불만들이 쌓인다.브레인스토밍도 없이 코드부터 쏟아내거나, 테스트는 나중으로 미루거나, 작업이 끝나도 정리됐는지 확인하지 않는다.결국 에이전트를 감시하는 시간이 에이전트를 쓰는 시간보다 더 길어진다. Superpowers는 이 문제를 에이전트 동작 자체를 바꾸는 방식으로 해결하고자 한다.Shell 스크립트 기반의 "스킬 프레임워크"로, Claude Code·Cursor·Codex·OpenCode·GitHub Copilot CLI·Gemini CLI에 설치하면 에이전트가 브레인스토밍 → 플랜 작성 → TDD → 코드 리뷰 → 브랜치 마무리로 이어지는 7단계 워크플로우를 따르게 된다.이 글은 각 스킬이 어떻게 동작하는지 코드를 따라가며 직접 ..
"하네스 엔지니어링" - Superpowers 리뷰 : 7단계 워크플로우와 14개 스킬 라이브러리 - 브레인스토밍부터 코드리뷰까지안녕하세요! 갓대희 입니다. AI 코딩 에이전트를 쓰다 보면 비슷한 불만들이 쌓인다.브레인스토밍도 없이 코드부터 쏟아내거나, 테스트는 나중으로 미루거나, 작업이 끝나도 정리됐는지 확인하지 않는다.결국 에이전트를 감시하는 시간이 에이전트를 쓰는 시간보다 더 길어진다. Superpowers는 이 문제를 에이전트 동작 자체를 바꾸는 방식으로 해결하고자 한다.Shell 스크립트 기반의 "스킬 프레임워크"로, Claude Code·Cursor·Codex·OpenCode·GitHub Copilot CLI·Gemini CLI에 설치하면 에이전트가 브레인스토밍 → 플랜 작성 → TDD → 코드 리뷰 → 브랜치 마무리로 이어지는 7단계 워크플로우를 따르게 된다.이 글은 각 스킬이 어떻게 동작하는지 코드를 따라가며 직접 ..
2026.04.22