spoonai
TOPAnthropicClaude Sonnet 5에이전틱AI

Anthropic이 Claude Sonnet 5를 내놨어 — 에이전트 돌리는 비용을 확 낮춘 '기본 모델'

6월 30일 출시된 Claude Sonnet 5는 코딩·브라우저·터미널 같은 자율 작업에 특화된 모델이야. Free·Pro 기본값이 됐고, 도입가는 입력 $2·출력 $10(8월 31일까지). Opus 4.8과의 격차를 좁히면서 가격은 5분의 1이야.

·8분 소요
공유
Anthropic Claude Sonnet 5 출시 — 에이전트 작업 특화 모델
출처: Anthropic

비싼 모델로만 되던 일이, 이제 5분의 1 가격짜리로 돌아가

자, 핵심부터 말할게. Anthropic이 6월 30일 Claude Sonnet 5를 출시했어. 그냥 또 하나의 모델 업데이트가 아니야. 이건 "에이전트를 돌리는 비용"을 정조준한 모델이거든. 계획을 세우고, 브라우저랑 터미널 같은 도구를 직접 쓰고, 사람이 옆에서 안 봐도 알아서 작업을 끝까지 끌고 가는 — 그런 자율 작업에 특화돼서 나왔어. 그리고 결정적으로, 출시되자마자 Claude Free랑 Pro 사용자의 기본 모델이 됐어. 별도로 안 골라도 너가 지금 Claude를 켜면 이 모델이 응답하고 있을 가능성이 높다는 얘기야.

가격이 진짜 핵심이야. 도입가가 입력 100만 토큰당 $2, 출력 $10이고 이건 8월 31일까지. 그 뒤엔 표준가인 $3 / $15로 올라가. 비교 대상인 최상위 모델 Opus 4.8은 입력 $15 수준이니까, 같은 토큰을 처리해도 Sonnet 5가 거의 한 자릿수 배수로 싸. "성능 좀 떨어져도 5배, 7배 싸면 그걸 쓴다"는 게 프로덕션 현장의 진리인데, Anthropic이 바로 그 지점을 노린 거지.

벤치마크를 보면 왜 이게 화제인지 더 분명해져. 에이전틱 코딩 테스트에서 Sonnet 5는 **63.2%**를 찍었어. 같은 테스트에서 Opus 4.8이 69.2%, 직전 모델 Sonnet 4.6이 58.1%였거든. 즉 "최상위 Opus만큼은 아니지만, 그 격차를 4.6 때보다 훨씬 좁혔다"는 거야. 심지어 지식 노동(knowledge work) 벤치마크에서는 Sonnet 5가 Opus 4.8을 살짝 앞서기까지 했어. 정확도가 생명인 작업엔 여전히 Opus를 쓰겠지만, "웬만한 에이전트 작업은 이제 Sonnet 5로 충분하다"는 선택지가 생긴 거지.

오늘 풀 이야기는 이거야. Anthropic이 왜 하필 지금 '싼 에이전트 모델'을 들고 나왔는지, 이게 개발자랑 기업한테 뭘 바꾸는지, 경쟁사들은 어떻게 받아칠지. 등장인물은 셋이야 — 모델을 만든 Anthropic, 가장 직접적으로 영향받을 개발자·기업, 그리고 같은 날 같은 시장을 노리는 OpenAI·Google 같은 경쟁 랩들.

등장인물 — Anthropic, 그리고 '에이전트 비용'에 허덕이던 사람들

먼저 Anthropic. Claude를 만드는 회사이고, 최근 몇 분기 동안 코딩·에이전트 영역에서 가장 강한 평가를 받아왔어. 다만 강점에는 그림자가 있었어. 제일 좋은 모델(Opus 계열)이 비싸다는 거야. 에이전트는 한 번 작업할 때 토큰을 어마어마하게 먹어. 사람이 한 문장 묻고 한 문단 답받는 챗봇이랑 달리, 에이전트는 스스로 수십 번 생각하고, 도구를 부르고, 결과를 다시 읽고, 또 생각해. 그 과정마다 토큰이 쌓이지. 그래서 "Claude로 에이전트 만들면 좋긴 한데 청구서가 무섭다"는 게 현장의 공통된 불만이었어.

다음은 개발자와 기업. 이들은 지난 1년간 '에이전트를 프로덕션에 올리고 싶지만 단가가 안 맞는' 딜레마에 갇혀 있었어. 데모로는 멋진데, 실제로 하루 수천 건 돌리면 모델 비용이 폭발하거든. 마침 이번 주 다른 뉴스로 GitHub Copilot의 사용량 과금 청구서가 10~50배로 튀었다는 사례가 쏟아졌잖아. 에이전트 비용 문제가 업계 전체의 화두였던 거지. Sonnet 5는 바로 그 사람들한테 "같은 일을 더 싸게"라는 답을 내민 셈이야.

세 번째는 경쟁 랩들. 공교롭게도 같은 시기에 OpenAI는 GPT-5.6(Sol·Terra·Luna)을 공개했어. 그중 Terra는 "GPT-5.5 성능을 절반 가격에", Luna는 "최저가 고속"이 콘셉트야. 즉 모두가 똑같이 '성능은 유지하되 가격을 깎는다'는 방향으로 달리고 있어. 2026년 상반기 AI 경쟁의 축이 '가장 똑똑한 모델'에서 '가장 가성비 좋은 에이전트 엔진'으로 옮겨갔다는 신호야.

이 셋을 한 문장으로 묶으면 이래. 에이전트를 돌리고 싶은 수요는 폭발했는데 비용이 발목을 잡고 있었고, Anthropic이 그 병목을 정조준한 '기본 모델'을 내놨다. 이게 뼈대야.

핵심 내용 — 숫자로 보면 이래

Sonnet 5가 내세우는 건 세 가지야. 자율성, 가성비, 그리고 안전성. 하나씩 보자.

항목 Sonnet 5 Opus 4.8 Sonnet 4.6
에이전틱 코딩 벤치 63.2% 69.2% 58.1%
입력 가격(100만 토큰) $2 (도입) / $3 ~$15 더 낮음
출력 가격(100만 토큰) $10 (도입) / $15 ~$75 더 낮음
지식 노동 벤치 Opus보다 소폭↑ 최상위 정확도 하위
기본 적용 Free·Pro 기본값 별도 선택 대체됨

표에서 두 가지가 눈에 띄어. 첫째, Sonnet 5는 Opus 4.8의 성능에 '근접'하면서 가격은 한참 아래야. 코딩에서 6%p 차이는 작지 않지만, 가격이 5배 이상 차이 나면 많은 작업에서 합리적인 트레이드오프가 돼. 둘째, Sonnet 4.6 대비 점프가 크다. 58.1 → 63.2는 한 세대 안에서 보기 드문 폭이야. 게다가 4.6은 올해 2월에 나왔으니, 불과 넉 달 만의 업그레이드지. 모델 수명 주기가 얼마나 빨라졌는지 보여주는 대목이야.

안전성도 Anthropic이 강조한 포인트야. Sonnet 5는 전작보다 '바람직하지 않은 행동' — 오용에 협조하거나, 속이거나 — 의 비율이 낮아졌고, 악의적 요청 거부와 프롬프트 인젝션(주입) 공격 회피에서 더 나아졌다고 밝혔어. 에이전트는 사람 손을 떠나 자율로 도구를 쓰기 때문에, "탈취당하지 않는 것"이 성능만큼 중요해. 브라우저를 자동으로 조작하는 에이전트가 악성 페이지의 숨은 지시를 따라가 버리면 큰일이거든. 그래서 자율성을 높이면서 동시에 안전 장치를 조인 건 자연스러운 설계야.

API 모델 문자열은 claude-sonnet-5. 기존 코드에서 모델 이름만 바꿔 끼우면 바로 쓸 수 있게 했어. 마이그레이션 마찰을 최소화해서 '기본값으로 자연스럽게 흡수'시키려는 전략이지.

각자의 이득 — 누가 웃나

개발자·스타트업이 가장 직접적으로 웃어. 그동안 "Claude 에이전트는 좋은데 비싸서 못 쓴다"던 작업들이 단가 안으로 들어왔거든. 코드 리뷰 봇, 자동 리팩터링, 문서 기반 리서치 에이전트처럼 토큰을 많이 먹는 워크플로우를 이제 현실적인 비용으로 상시 돌릴 수 있어. 게다가 Free·Pro 기본값이라, 비개발자 사용자도 별도 설정 없이 더 똑똑한 에이전트를 체감하게 돼.

Anthropic 자신도 영리하게 이득을 챙겨. IPO를 향해 달려가는 이 시점에 '가장 비싼 모델 회사'라는 이미지는 부담이야. 싼 기본 모델을 깔면 사용량(토큰 소비)이 늘고, 개발자 생태계가 Claude 위에서 더 두터워져. 단가는 낮춰도 총량이 커지면 매출은 받쳐주는 구조지. "성능은 Opus, 볼륨은 Sonnet"이라는 이층 구조를 완성한 거야.

Claude 위에서 제품을 만드는 회사들도 수혜야. Cursor, 각종 코딩 에이전트, AI 워크플로우 SaaS들은 모델 비용이 곧 원가야. 그 원가가 내려가면 마진이 늘거나, 그 절감분을 사용자 가격 인하로 돌려 경쟁력을 키울 수 있어. 모델 한 줄 바꿨을 뿐인데 손익계산서가 달라지는 거지.

과거 유사 사례 — 성공과 실패

비슷한 장면을 우리는 이미 봤어. **OpenAI의 GPT-4o mini, Anthropic의 Haiku 같은 '저가 고속 라인'**이 대표적이야. 프런티어 모델로 화제를 만든 뒤, 한 단계 아래의 싼 모델로 대량 채택을 노리는 전략은 검증된 공식이지. 다만 이번 Sonnet 5가 다른 점은, '미니'급의 저가 모델이 아니라 '준-플래그십' 성능을 저가에 꽂았다는 거야. 타협의 폭이 훨씬 작아진 거지.

성공 사례의 핵심은 '기본값의 힘'이야. 한 번 기본 모델로 깔리면, 대다수 사용자는 굳이 바꾸지 않아. 그 관성이 곧 사용량이 되고, 사용량이 곧 데이터·피드백·생태계가 돼. 검색에서 구글이, 모바일에서 기본 앱들이 누렸던 그 효과를 모델 시장에서 재현하려는 시도야.

실패의 교훈도 있어. 싼 모델을 너무 공격적으로 밀면 '비싼 모델은 왜 사느냐'는 자기잠식(카니발라이제이션)이 생겨. 또 도입가 프로모션이 끝나고 표준가($3/$15)로 오를 때, 그 인상을 사용자가 어떻게 받아들이냐가 관건이야. GitHub Copilot의 과금 쇼크가 보여줬듯, 가격은 올릴 때 가장 아프거든. Anthropic이 8월 31일 이후 가격 전환을 얼마나 매끄럽게 관리하느냐가 다음 시험대야.

왜 하필 '지금'인지도 짚어볼 만해. Anthropic은 대형 IPO를 향해 달리고 있다는 보도가 나오는 시점이야. 공개 시장 투자자들은 화려한 벤치마크보다 '사용량이 실제로 늘고 있는가'를 보거든. 그런데 '가장 비싼 랩'이라는 이미지는 그 성장 서사에 걸림돌이야. 싼 기본 모델로 더 많은 워크로드를 Claude로 끌어오면, 그게 바로 기업가치를 떠받치는 성장 스토리가 돼. 즉 Sonnet 5는 단순한 제품 출시가 아니라 '재무 서사' 카드이기도 해. 경쟁의 다음 국면은 리더보드 한 줄이 아니라 채택 곡선에서 결판난다고 Anthropic이 판단한 거지.

경쟁자 카운터 플레이 — 다음 수는

OpenAI의 카운터는 이미 진행 중이야. GPT-5.6 Terra가 "GPT-5.5 성능을 절반값에"를 내걸었고, Luna는 최저가 라인이야. 게다가 Broadcom과 만든 추론 칩 '할라페뇨'로 추론 단가 자체를 하드웨어 레벨에서 낮추겠다는 그림도 그렸어. 즉 OpenAI는 '모델 가격 인하 + 자체 칩으로 원가 절감'이라는 양면 전략으로 응수하고 있어.

Google은 Gemini의 가성비 라인과 자체 TPU 인프라를 무기로 둬. 구글은 원래 인프라를 직접 소유한 회사라 단가 경쟁에선 구조적으로 유리해. "우리는 칩부터 모델까지 다 가졌으니 가격을 더 내릴 여력이 있다"는 메시지를 강화할 가능성이 커.

**중국 오픈웨이트 진영(Qwen, GLM, DeepSeek)**은 아예 '공짜' 카드로 압박해. 가중치를 풀어버리니 기업이 자기 서버에 올려 운영비만 내고 쓸 수 있거든. Anthropic이 Sonnet 5로 단가를 낮춰도, "우리는 0원"이라는 오픈 모델의 공세는 계속될 거야. 결국 프런티어 랩들은 '단순 가격'이 아니라 안전성·통합·신뢰·책임 소재 같은 패키지로 차별화를 밀 수밖에 없어.

그래서 뭐가 달라지는데

개발자라면 — 지금 쓰던 에이전트 파이프라인의 모델 문자열을 claude-sonnet-5로 바꿔보고 비용·품질을 직접 재보는 게 1순위야. 많은 작업에서 Opus를 Sonnet 5로 내려도 체감 품질 차이가 작은데 청구서는 확 줄 수 있어. 다만 정확도가 생명인 일부 작업(법률·의료·금융 분석 등)은 여전히 Opus를 남겨두는 하이브리드 라우팅이 현명해. "쉬운 건 Sonnet, 어려운 건 Opus"로 나누는 거지.

기업 의사결정자라면 — 에이전트 도입을 미뤄왔다면 단가 핑계가 하나 줄었어. 다만 도입가($2/$10)는 8월 31일까지라는 점, 9월부터 $3/$15로 오른다는 점을 예산에 반영해야 해. 토큰 사용량 모니터링과 상한 설정은 필수야. 싸졌다고 무제한으로 풀면 에이전트가 토큰을 폭식해서 결국 비싸질 수 있거든.

일반 사용자라면 — 너가 Free나 Pro로 Claude를 쓰고 있다면, 이미 Sonnet 5를 쓰고 있을 가능성이 높아. 복잡한 다단계 작업이나 도구를 쓰는 작업에서 전보다 더 매끄럽게 끝까지 처리하는 걸 체감할 수 있을 거야. 특별히 설정을 바꿀 필요는 없어.

🥄 남은 궁금증 세 가지

— 그래서 이제 Opus는 필요 없는 거야? 아니야. 정확도가 최상이어야 하는 작업에선 Opus 4.8이 여전히 위야. Sonnet 5는 "Opus만큼은 아니지만 충분히 좋고 훨씬 싸다"는 포지션이지, Opus를 대체하는 게 아니야. 실무에선 둘을 섞어 쓰는 게 정답에 가까워.

— 도입가 끝나면 가격이 확 오르는 거 아니야? $2/$10에서 $3/$15로 오르는 건 맞아. 50% 인상이라 작지 않아. 다만 그래도 Opus보다는 한참 싸. 8월 31일 전에 너의 워크로드 단가를 미리 계산해두고, 9월 이후 예산을 잡아두는 게 좋아.

— OpenAI GPT-5.6이랑 비교하면 뭐가 나아? 단정하긴 일러. 같은 주에 둘 다 '싼 에이전트 모델'을 내놔서 직접 비교 데이터가 아직 충분치 않아. 코딩·도구 사용은 Claude 계열이 강하다는 평이 많지만, 너의 실제 작업으로 둘 다 돌려보고 비용 대비 품질을 재보는 게 제일 정확해.

참고 자료

숫자와 기준은 발표 시점 기준이라 바뀔 수 있어. 투자 판단은 각자의 몫!

관련 기사

무료 뉴스레터

AI 트렌드를 앞서가세요

매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.

매일 30개+ 소스 분석 · 한국어/영어 이중 언어광고 없음 · 1-클릭 해지