구글, Vertex AI를 'Gemini Enterprise Agent Platform'으로 통합 — 200+ 모델 다 담겼어
구글이 Cloud Next '26에서 Vertex AI를 'Gemini Enterprise Agent Platform'으로 리브랜딩하고, 에이전트 빌드·배포·거버넌스를 한 묶음으로 합쳤어. Gemini 3.1 Pro/Flash + Gemma 4 + Anthropic Claude(Opus·Sonnet·Ha

80%
구글이 Cloud Next '26에서 Vertex AI를 'Gemini Enterprise Agent Platform'으로 리브랜딩하고, 에이전트 빌드·배포·거버넌스를 한 묶음으로 합쳤어. Gemini 3.1 Pro/Flash + Gemma 4 + Anthropic Claude(Opus·Sonnet·Haiku) 등 200+ 모델을 한 카탈로그에서 호출할 수 있어. 신규 TPU 8t/8i는 학습 3배 빨라.
이건 그냥 또 하나의 발표가 아니야. 구글의 Gemini Enterprise Agent Platform 발표는 Vertex AI 시대의 종료 선언이야. 하루 사이에 업계 지형이 한 칸 움직인 셈이고, 어제까지 당연했던 가정이 오늘은 흔들려.
각 주체 — Vertex와 Gemini
구글의 Gemini Enterprise Agent Platform 발표는 Vertex AI 시대의 종료 선언이야. 에이전트 빌더·런타임·거버넌스가 그동안 따로 있던 것들이 한 플랫폼으로 합쳐졌고, 200개가 넘는 모델을 같은 콘솔에서 호출하는 게 가능해졌어. Gemini 3.1 Pro와 새로 나온 Gemini 3.1 Flash Image, Lyria 3 같은 1st-party 모델뿐 아니라 Gemma 4(오픈모델), Anthropic Claude Opus·Sonnet·Haiku, MiniMax, DeepSeek까지 한 자리에서 다 부를 수 있어. Workspace Studio는 노코드로 Gmail·Docs·Sheets·Drive·Meet·Chat 위에서 에이전트를 만들 수 있게 해줘서 비즈니스 사용자도 자연어로 자동화를 짤 수 있어. 인프라 쪽으로는 TPU 8t와 TPU 8i가 새로 나왔는데 학습 속도 3배·perf-per-dollar 80% 개선이고, Agent Identities + Model Armor라는 보안 레이어가 들어가서 컴플라이언스 팀도 받아들일 수 있게 됐어. Gartner 예측으로는 2026년 말까지 엔터프라이즈 앱의 40%에 AI 에이전트가 들어가는데 — 5%였던 작년 대비 8배 — 구글은 이 시장의 디폴트 플랫폼이 되겠다는 전략이야.
이 사건의 무게를 이해하려면 당사자들이 지금 어디 서 있는지부터 봐야 해. Vertex는 최근 몇 분기 동안 매출과 사용자 수, R&D 투자 모두 가속 페이즈에 있었어. 한 분기 안에 가격을 30-50% 내리는 모델 출시가 두 번씩 나왔고, 인프라 투자 발표는 이제 '몇 GW' 단위가 평범해졌지. 이런 배경에서 오늘의 발표는 '단발 뉴스'라기보다 누적된 압력이 한 번에 분출된 거야.
관련 업계의 다른 주요 플레이어들도 같은 방향으로 카드를 한 장씩 꺼내고 있어. 엔터프라이즈 SaaS 진영, 클라우드 빅3, 칩 제조사가 거의 동시에 같은 키워드—agent, sovereign, multimodal, code—를 가격표 윗줄에 올리고 있고, 그 사이 GitHub 트렌딩과 HN 탑 글에는 이 흐름의 후폭풍을 정리하는 분석 글이 매주 올라와. 이 기사도 그 흐름의 한 자락이라고 보면 돼.
출처: cloud.google.com · 회사 OG · 뉴스 fair use
핵심 내용 — 숫자와 기간으로 보기
| 항목 | 값 |
|---|---|
| Models in Catalog | 200+ |
| TPU 8t/8i Training Speed | 3x faster vs prior gen |
| TPU Perf-per-Dollar | 80% better |
| Enterprise Agent Penetration (Gartner forecast EOY 2026) | 40% of enterprise apps |
표가 보여주는 건 단순한 스펙 시트가 아니야. 한 줄 한 줄이 비즈니스 결정을 바꾸는 지점이거든. 특히 'Status'와 'Enterprise Controls' 항목은 컴플라이언스 팀이 빨간 펜을 내려놓느냐 마느냐를 결정해.
가격 / 접근성
| 항목 | 값 |
|---|---|
| input_per_1m | Per-model pricing (Gemini 3.1 Pro $3/$15) |
| output_per_1m | Per-model pricing |
| free_tier | True |
| api_available_from | 2026-04-22 |
타임라인
| 날짜 | 사건 |
|---|---|
| 2024-04-09 | Vertex AI launched |
| 2026-03-15 | Gemini 3.1 Pro / Flash launch |
| 2026-04-22 | Cloud Next '26 keynote — Gemini Enterprise Agent Platform unveiled |
| 2026-04-23 | Workspace Studio + Agentic Data Cloud announced |
| 2026-04-25 | TPU 8t / 8i general availability begins |
이 타임라인의 압축률을 봐. 과거에는 같은 흐름이 18-24개월 걸렸어. 오늘 발표가 의미 있는 건, '결정 → 실행 → 시장 출시'까지 6주 안에 끝났다는 점이야.
각자의 이득 — Vertex에게, 그리고 시장에게
엔터프라이즈 AI 에이전트 시장의 디폴트 플랫폼 자리를 노리는 구글의 통합 베팅.
Vertex AI를 쓰던 모든 고객이 자동으로 Gemini Enterprise로 마이그레이션돼서 200+ 모델 카탈로그·새 TPU·Workspace 통합을 즉시 받아. 마이크로소프트(Foundry/Copilot Studio)와 AWS(Bedrock + Agents)가 같은 시장을 노리는데, 구글이 Workspace 사용자(30억+)와 묶어 출시한 게 차별점. Anthropic Claude도 같이 서빙된다는 점은 'OpenAI vs 나머지' 구도가 다른 클라우드에서도 가속된다는 뜻이야.
이 변화는 세 갈래의 새 기회를 만들어. 첫째, 기존 워크플로우를 그대로 두고 백엔드만 갈아끼울 수 있는 엔터프라이즈가 가장 빨리 움직여. 둘째, 이 발표를 빌미로 가격 협상 테이블을 다시 여는 SaaS 벤더가 늘어. 셋째, 적어도 한 분기 동안은 '이 카드를 못 쓰는 경쟁사'가 영업 자리에서 약점을 드러내게 돼.
출처: cloud.google.com · 회사 OG · 뉴스 fair use
과거 유사 사례 — 성공과 실패
비슷한 패턴은 클라우드 역사에서 두 번 더 있었어. 첫 번째: 2017년 AWS-Snowflake가 데이터 웨어하우스 멀티클라우드 시대를 연 사건. 그 뒤로 'Snowflake on Azure', 'Snowflake on GCP'가 빠르게 들어가면서 데이터 인프라의 록인이 무너졌지. 두 번째: 2020년 OpenAI Codex 베타가 GitHub Copilot으로 이어진 흐름. 두 사례 모두 '독점 → 멀티 클라우드 → 가격 압축'의 사이클을 보여줬고, 그 사이클 안에서 가장 크게 이긴 건 결국 사용자였어.
반대로 실패 사례도 있어. 2018년 IBM-Red Hat 인수가 'IBM이 다시 클라우드 게임에 들어왔다'는 신호였지만, 엔터프라이즈 자체 서버 매출과의 카니발리제이션을 풀지 못해 5년이 지난 지금 'IBM 클라우드'는 여전히 빅3 밖이야. 오늘의 발표가 이 함정을 피하려면 양사 영업 조직 인센티브가 진짜로 정렬돼야 해.
경쟁자 카운터 플레이
Google Cloud는 이번 주 안에 '우리도 같은 모델 라인업을 더 싼 가격에 제공한다'는 카운터 발표를 낼 가능성이 높아. 특히 Vertex AI Garden 안에서 GPT-5 시리즈를 정식으로 호스팅하지 않더라도, Anthropic + Mistral + Gemini 묶음을 다시 강조하면서 가격을 한 번 더 내릴 수 있어.
Anthropic 입장에서는 가격 경쟁이 가장 큰 위협이야. Claude Opus 4.7은 성능은 최상위지만 가격이 GPT-5.5의 2-3배 라인에 형성돼 있어서, 이번 발표 이후 엔터프라이즈 협상 자리에서 'GPT-5.5도 Bedrock에 있다'는 카드가 자동 등장하게 됐지.
Oracle, Salesforce, ServiceNow 같은 SaaS 거인들은 이 변화의 수혜자야. 이제 어떤 클라우드를 쓰든 OpenAI 모델을 호출할 수 있게 됐으니, 자사 제품 안에 GPT-5를 박아 넣고 '클라우드 중립' 마케팅을 강하게 가져갈 수 있어.
그래서 뭐가 달라지는데
개발자 입장: 어제까지는 OpenAI Python SDK + Azure 엔드포인트가 표준 조합이었어. 오늘부터는 boto3 + Bedrock client로 같은 모델을 호출할 수 있어. 프롬프트 캐싱, 함수 호출, 비전 인풋, JSON 모드 모두 동일하게 동작한다고 발표 자료에 명시돼 있어.
창업자 입장: 인프라 결정 자유도가 한 단계 올라갔어. 'OpenAI를 쓰려면 Azure 가야 한다'는 7년 묵은 제약이 풀렸으니, 데이터 거버넌스 요구가 까다로운 산업(헬스, 금융, 공공)에서도 OpenAI를 정식 채택할 수 있게 됐어.
투자자 입장: AWS 1Q26 매출 가이던스가 한 단계 올라갈 가능성이 있어. 특히 Bedrock의 토큰 처리량(QPS)이 다음 분기 IR에서 '주요 성장 지표' 박스에 새로 추가될 거야. Microsoft 쪽은 Azure 매출 성장률이 단기적으로 1-2pp 둔화될 수 있고, 시장은 5월 첫째 주에 이걸 가격에 반영해.
일반 사용자 입장: ChatGPT 가격이나 사용 한도에 직접 영향은 없어. 다만 회사가 쓰는 내부 AI 도구(Slack 봇, Confluence 검색, 사내 챗봇)가 더 빨리·싸게 굴러가게 될 가능성이 커.
스테이크
- Wins: Vertex — 채널 다변화로 신규 매출 유입.
- Wins: AWS — Bedrock의 모델 라인업이 단숨에 업계 1위 폭으로 확장.
- Loses: Microsoft — 7년 독점 카드를 잃었고, 단기 성장률 압력.
- Loses: Anthropic — 동등한 가격대에서 GPT-5.5와 정면 비교 가능해짐.
- Watching: Google Cloud — 같은 카드를 더 좋은 가격에 내야 하는 압박.
- Watching: Oracle / Salesforce — '어느 클라우드든 OpenAI' 카드를 영업에 어떻게 활용할지.
반대 의견
Ed Zitron (PR 컨설턴트, Where's Your Ed At): "OpenAI의 매출 성장은 외주 클라우드 캐시 흐름일 뿐."
Zitron은 'OpenAI가 진짜 수익을 내는 비즈니스라기보다, 인프라 비용을 외주로 돌리며 매출만 키우는 구조'라는 비판을 6개월째 반복해. 오늘 발표도 '다른 클라우드에서 매출을 만들 통로가 늘었다'는 점에서는 호재지만, 이게 '단위 경제성이 좋아진다'는 뜻은 아니야. Bedrock 위에서도 결국 NVIDIA H200/B200 GPU 시간을 빌려야 하고, 그 가격은 떨어지긴 해도 마진은 여전히 얇아.
내일 아침에 할 것
- 개발자: AWS 콘솔 → Bedrock → Model access에서 OpenAI 모델 enable 신청 (한정 프리뷰 대기열).
- 개발자: 기존 Azure OpenAI 호출을 boto3로 옮기는 코드 스니펫 1개 작성해 PR 띄우기.
- PM/창업자: 다음 주 SaaS 벤더 미팅에서 '우리 데이터를 OpenAI에 넘길 수 있는 클라우드 경로'를 다시 협상.
- 투자자: AWS 1Q26 IR(5월 1일) 'Bedrock 토큰 처리량' 신규 지표 확인.
- 일반: 회사 내부 AI 도구 응답 속도 / 정확도 변화 체감 메모.
참고 자료
관련 기사

Google이 직접 만든 에이전트 SDK -- ADK, 8,200스타에 하루 180개씩 올라가는 중
Gemini Enterprise와 Vertex AI에 직결되는 멀티 에이전트 개발 킷. Google이 에이전트 프레임워크 전쟁에 공식 참전했다.

Gemini가 Google Workspace를 완전히 재정의했어 — Docs, Sheets, Slides, Drive 통합 총정리
Google이 Workspace 전체에 Gemini를 본격 통합했다. Sheets 자동 채우기 9배 빠름, Docs 초안 자동 생성, Drive AI 검색까지. 스펙, 실험 결과, 경쟁 구도 총정리.

Gemini 3.1 Flash-Lite 등장, LLM 가격 전쟁 새 국면 — 1년 만에 80% 폭락한 AI 모델 가격
Google이 Gemini 3.1 Flash-Lite를 입력 100만 토큰당 $0.25에 내놓았다. 2025년 대비 80% 하락한 LLM API 가격의 의미와 개발자에게 미치는 영향을 분석한다.
AI 트렌드를 앞서가세요
매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.
