spoonai
TOPGoogleGeminiLLM

구글 Gemini 3.5 Pro, 6월 정식 출시 임박 — 200만 토큰에 'Deep Think'까지

구글이 I/O에서 공개한 Gemini 3.5 Pro가 6월 일반 출시(GA)를 코앞에 뒀어. 200만 토큰 컨텍스트와 'Deep Think' 추론 모드를 얹은 플래그십인데, 피차이가 '다음 달까지만 기다려달라'고 했지. Flash가 이미 9억 사용자를 깔아둔 위에 올라타는 모델이야.

·7분 소요
공유
구글 CEO 순다르 피차이
출처: Wikimedia Commons

'곧 나온다'는 모델이 왜 이렇게 화제일까

아직 정식 출시도 안 한 모델이 업계 대화를 장악하는 일은 흔치 않아. Gemini 3.5 Pro가 그래. 구글이 5월 19일 I/O에서 공개했고, 6월 일반 출시(GA)를 코앞에 뒀어. 순다르 피차이는 키노트에서 "다음 달까지만 기다려달라(give us until next month)"고 했지 — 즉 6월이라는 뜻인데, 확정 날짜는 안 박았어. 6월 초 기준으로 이 모델은 아직 정식 배포 전이고, 내부 사용과 엔터프라이즈 제한 프리뷰 단계에 머물러 있어.

스펙은 묵직해. 200만(2M) 토큰 컨텍스트 창에, Deep Think라는 추론 모드를 얹었어. 2M 토큰은 2026년 5월 기준 프로덕션 프론티어 모델 중 가장 큰 컨텍스트 중 하나이고, 형제 모델인 Gemini 3.5 Flash(1M)의 두 배야. Deep Think는 어려운 문제에서 모델이 더 깊고 길게 추론하도록 하는 모드인데, 흥미롭게도 월 250달러짜리 'Ultra' 구독 등급에 묶여 있어. 월 20달러 Pro 플랜이 아니라.

가격도 포지션을 말해줘. 입력 100만 토큰당 약 15달러, 출력 60달러 수준으로 거론되는데, 이건 Gemini 3.5 Flash의 약 10배야. 즉 Gemini 3.5 Pro는 '값싼 대중형'이 아니라 '최상위 난도 작업을 위한 프리미엄 플래그십'으로 자리매김하는 거야. 같은 주에 xAI가 '98% 싸게'를 외치고 Moonshot이 오픈웨이트를 푸는 와중에, 구글은 정반대 끝 — '가장 크고 깊은 모델'로 차별화하는 그림이지.

등장인물 — 구글, Gemini 패밀리, 그리고 피차이의 '에이전틱 시대' 선언

첫 번째 주인공은 **구글(그리고 딥마인드)**이야. 한때 'AI 경쟁에서 뒤처졌다'는 소리를 듣던 구글은 Gemini 시리즈로 빠르게 반격했어. I/O 2026에서 피차이는 아예 '에이전틱 Gemini 시대(agentic Gemini era)'를 선언했고, Gemini 앱이 5월 19일 기준 월 9억 명(900M) 활성 사용자를 넘었다고 밝혔어. 검색·안드로이드·워크스페이스라는 거대한 유통망 위에 AI를 까는 게 구글의 가장 큰 무기야.

두 번째 주인공은 Gemini 3.5 패밀리 자체야. Flash(빠르고 싼 대중형)와 Pro(크고 깊은 프리미엄)로 나뉘는 구조인데, Flash가 먼저 나와 9억 사용자라는 거대한 기반을 깔았고, 이제 그 위에 Pro가 얹히는 순서야. 여기에 I/O에선 어떤 형식이든 입출력하는 'Gemini Omni'와 Ultra 전용 에이전트 'Gemini Spark'까지 공개됐어. 즉 Pro는 단발 모델이 아니라 '패밀리 전략'의 정점이야.

세 번째 주인공은 순다르 피차이 본인이야. 그가 키노트에서 보낸 메시지는 분명했어 — 구글은 더 이상 추격자가 아니라, AI 시대 제품 전반을 재설계하는 주체라는 거지. 다만 그는 Pro의 GA 날짜를 확정하지 않고 "다음 달까지 기다려달라"고만 했어. 가장 강력한 모델일수록 안정성·안전성 검증에 시간이 걸린다는 신호이자, 동시에 '곧 나온다'는 기대감을 시장에 깔아두는 화법이기도 해.

핵심 내용 — 숫자로 보는 Gemini 3.5 Pro

항목 내용
공개 2026년 5월 19일 (Google I/O)
GA 목표 2026년 6월 (확정일 미정)
컨텍스트 200만(2M) 토큰
핵심 기능 Deep Think 추론 모드
Deep Think 접근 월 250달러 Ultra 등급
가격(거론) 입력 ~$15 / 출력 ~$60 (100만 토큰당)
형제 모델 Gemini 3.5 Flash (1M, 약 1/10 가격)
현재 상태 내부 사용 + 엔터프라이즈 프리뷰

가장 눈에 띄는 건 '2M 컨텍스트'야. 200만 토큰이면 두꺼운 책 여러 권, 거대한 코드베이스, 방대한 문서 더미를 한 번에 모델에 넣고 질문할 수 있다는 뜻이야. 긴 문맥을 잘게 쪼개 넣는 번거로움이 줄고, 모델이 전체 맥락을 한꺼번에 보면서 답하니 일관성이 올라가. 법률·연구·대규모 코드 분석처럼 '긴 맥락이 곧 품질'인 작업에선 결정적 차이를 만들어.

Deep Think를 월 250달러 Ultra에만 묶은 건 전략적이야. 가장 강력한 추론 능력을 최상위 유료 등급의 차별화 포인트로 쓰는 거지. 일반 사용자는 빠른 응답을, 기꺼이 돈을 더 내는 헤비 유저·전문가는 깊은 추론을 — 이렇게 사용층을 가격으로 분리하는 거야. AI가 '월 20달러 평등 서비스'에서 '용도별·등급별 차등 서비스'로 분화하고 있다는 흐름을 보여주는 대목이기도 해.

다만 짚어둘 건, 6월 초 기준으로 Pro는 '아직 안 나왔다'는 점이야. 발표와 실제 배포 사이엔 늘 간극이 있고, 피차이의 "다음 달" 발언처럼 GA가 미뤄지거나 단계적으로 풀릴 수 있어. 벤치마크 숫자나 가격도 정식 출시 시점에 조정될 여지가 있고. 그래서 지금 단계의 Gemini 3.5 Pro는 '확정된 제품'이라기보단 '곧 도착할, 매우 구체적인 예고편'으로 보는 게 정확해.

각자의 이득 — 누가 이 플래그십으로 뭘 얻나

구글은 '프론티어 최상단'이라는 자리를 지키려 해. 9억 사용자라는 거대한 기반(Flash) 위에 '가장 크고 깊은 모델'(Pro)을 얹으면, '대중성'과 '최고 성능'을 동시에 잡는 그림이 완성돼. 경쟁사들이 효율·가성비로 몰려갈 때, 구글은 '우리만 할 수 있는 초대형 컨텍스트와 깊은 추론'으로 차별화하는 거야. 검색·안드로이드·클라우드라는 유통망이 이 전략의 든든한 뒷배고.

엔터프라이즈 고객은 2M 컨텍스트에서 직접 이득을 봐. 방대한 사내 문서, 거대한 코드베이스, 긴 법률·연구 자료를 통째로 넣고 분석하는 작업이 훨씬 수월해지거든. 현재 Vertex AI 엔터프라이즈 프리뷰로 먼저 풀린 것도 이 때문이야 — 긴 맥락의 가치를 가장 절실히 느끼는 게 기업 워크로드거든. Deep Think까지 더하면, 복잡한 분석·의사결정 보조에서 차별적 품질을 기대할 수 있어.

헤비 유저·전문가는 월 250달러 Ultra라는 새 선택지를 얻어. 비싸 보이지만, 깊은 추론이 생산성을 크게 끌어올리는 직군(개발자, 연구자, 분석가)에겐 충분히 값할 수 있어. 'AI에 월 250달러를 쓰는 게 합리적인 사람'이라는 새로운 사용자층이 형성되고 있는 거야. 반대로 일반 사용자에겐 Flash와 무료 등급으로 충분하니, 가격 차등이 오히려 각자에게 맞는 선택지를 주는 셈이지.

과거 유사 사례 — '발표와 출시 사이'의 성공과 실패

'I/O에서 멋지게 발표했지만 실제 출시가 늦거나 기대에 못 미친' 사례는 구글 역사에 적지 않아. 과거 여러 AI 데모가 '곧 나온다'고 했다가 조용히 미뤄지거나, 막상 나왔을 때 데모만큼 매끄럽지 않았던 적이 있었지. 그래서 피차이의 "다음 달까지 기다려달라"는 화법을 시장은 '기대 반, 의심 반'으로 받아들여. 구글의 발표는 늘 화려한데, 관건은 '약속한 그대로, 약속한 때에' 나오느냐거든.

반대로 성공적으로 안착한 사례도 있어. Gemini Flash 라인이 대표적이야. 빠르고 싼 모델로 대중 시장을 빠르게 장악하며 9억 사용자라는 기반을 만들었잖아. '거대한 유통망 위에 적절한 모델을 얹으면 폭발적으로 퍼진다'는 걸 구글 스스로 증명한 거지. Pro 전략은 이 성공 위에 '프리미엄 층'을 더 쌓는 거라, 기반 자체는 탄탄해.

다만 경쟁 환경이 달라졌다는 게 변수야. 예전엔 '큰 컨텍스트'가 강력한 차별점이었지만, 이제 200만 토큰급 컨텍스트는 여러 프론티어 모델이 따라붙고 있어. 즉 'Pro만의 독점적 우위'가 얼마나 오래갈지는 미지수야. 발표 시점엔 인상적이어도, 실제 GA 시점엔 경쟁사가 비슷한 스펙을 들고 나와 있을 수 있거든. 그래서 진짜 차별점은 '숫자'보다 '실사용 품질과 생태계 통합'에서 갈릴 거야.

경쟁자 카운터 플레이 — OpenAI·Anthropic·오픈 진영은 어떻게 맞서나

OpenAI는 '제품 통합과 사용자 기반'으로 맞서. ChatGPT는 이미 거대한 사용자층과 강력한 브랜드를 갖고 있어서, 컨텍스트 크기나 추론 모드 같은 스펙 경쟁만으론 흔들리지 않아. OpenAI도 자체 추론 모델과 긴 컨텍스트를 밀고 있고, '가장 익숙한 AI 인터페이스'라는 점을 무기로 삼지. 구글의 9억 vs OpenAI의 사용자 기반, 이 '유통망 싸움'이 핵심 전장이야.

Anthropic은 '코딩·에이전틱 신뢰성'으로 차별화해. Claude는 특히 개발자 사이에서 코딩·에이전트 작업의 신뢰도로 강한 평판을 쌓았어. 구글이 '가장 큰 컨텍스트'를 내세우면, Anthropic은 '가장 믿을 만한 작업 수행'으로 맞서는 구도지. 긴 컨텍스트가 곧 좋은 결과를 보장하는 건 아니거든 — 맥락을 많이 넣는 것과 그 맥락을 정확히 활용하는 건 다른 능력이야.

오픈 진영(Moonshot, DeepSeek 등)과 가성비 진영(xAI Grok 4 Fast)은 정반대 방향에서 압박해. 구글이 '월 250달러 프리미엄'으로 위쪽을 노릴 때, 이들은 '싸거나 아예 무료'로 아래쪽을 장악하거든. 시장이 '프리미엄 vs 가성비'로 양극화되면, 구글의 Pro는 '비싼 값을 하는가'를 끊임없이 증명해야 해. 9억 사용자 기반이 든든하지만, 그 기반의 대부분은 무료·저가 층이라는 점도 잊으면 안 돼.

그래서 뭐가 달라지는데 — 입장별로 보면

개발자·엔터프라이즈라면, 2M 컨텍스트와 Deep Think가 '긴 맥락·복잡한 추론' 작업의 새 옵션이 된다는 의미야. 거대한 코드베이스나 방대한 문서를 다루는 워크로드라면, GA 이후 Vertex AI에서 직접 테스트해볼 가치가 있어. 다만 가격이 Flash의 10배인 만큼, '정말 긴 맥락·깊은 추론이 필요한 작업'에 선별적으로 쓰는 게 현명해.

프로덕트·전략 담당이라면, 'AI 서비스의 등급 분화'라는 흐름을 읽어야 해. 구글이 Deep Think를 월 250달러에 묶은 건, AI가 '평등한 단일 요금'에서 '용도별 차등 요금'으로 가고 있다는 신호거든. 네 제품에서도 AI 기능을 어떻게 등급화하고 가격을 매길지, 이 사례가 참고가 될 수 있어.

일반 사용자라면, 당장은 무료·저가 등급(Flash)으로 충분해. Pro와 Deep Think는 '돈을 더 내고 더 깊은 성능을 원하는' 헤비 유저용이야. 다만 '곧 출시'라는 예고이니, 6월 중 정식 출시되면 어떤 형태로 일반 사용자에게 풀리는지 지켜볼 만해. 발표와 실제 출시 사이엔 늘 간극이 있다는 것도 염두에 두고.

🥄 남은 궁금증 세 가지

— 그래서 지금 쓸 수 있는 거야? 아직 아니야. 6월 초 기준으로 Gemini 3.5 Pro는 내부 사용과 엔터프라이즈 프리뷰 단계고, 일반 GA는 6월 중 예정이야. 피차이도 "다음 달까지 기다려달라"고만 했지 확정 날짜를 안 박았어. '곧 나온다'는 예고로 받아들이는 게 정확해.

— 200만 토큰이면 뭐가 좋은 거야? 책 여러 권 분량을 한 번에 모델에 넣고 질문할 수 있다는 거야. 긴 문서·거대한 코드베이스를 쪼개지 않고 통째로 다룰 수 있어 일관성이 올라가지. 다만 '많이 넣는 것'과 '그걸 정확히 활용하는 것'은 다른 문제라, 실사용 품질은 GA 후 직접 봐야 단정할 수 있어.

— 월 250달러 Deep Think, 그만한 값을 해? 사람마다 달라. 깊은 추론이 생산성을 크게 높이는 전문직(개발·연구·분석)엔 값할 수 있지만, 일반 용도엔 과해. 단정하긴 일러 — 정식 출시 후 Deep Think가 실제로 어려운 과제에서 얼마나 차이를 내는지 검증돼야 '값어치'를 말할 수 있어.

참고 자료

수치는 발표 시점 기준이라 바뀔 수 있어.

관련 기사

무료 뉴스레터

AI 트렌드를 앞서가세요

매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.

매일 30개+ 소스 분석 · 한국어/영어 이중 언어광고 없음 · 1-클릭 해지