spoonai
TOPDeepSeekPricingAI Price War

딥시크가 주력 V4-Pro 가격을 75% '영구' 인하했어 — AI 가격 전쟁이 프로모션을 넘어 구조로 들어간 거야

5월 31일 끝날 예정이던 딥시크 V4-Pro 75% 할인이 영구 인하로 바뀌었어. 이제 100만 토큰당 입력 약 0.435달러·출력 0.87달러, 기존의 4분의 1 수준이야. 화웨이 어센드 950 슈퍼노드 가용성이 저가를 떠받치는 배경으로 지목되는데, GPT-5·제미나이 3.5 플래시 대비 가격 우위를 굳히면서 추론 비용 경쟁이 새 국면에 들어갔어.

·7분 소요·InfoWorldInfoWorld
공유
딥시크 V4-Pro 가격 75% 영구 인하 — AI 추론 가격 전쟁
출처: NIST CAISI

'한시 할인'인 줄 알았던 75%가, 그냥 새 정가가 돼버렸어

딥시크(DeepSeek)가 주력 모델 V4-Pro의 75% 할인을 영구 인하로 못 박았어. 원래 이 할인은 5월 31일에 끝나는 한시 프로모션이었거든. 그런데 5월 22~23일경 딥시크가 "이 가격이 그냥 정가다"라고 선언했고, 블룸버그·엔가젯·인포월드가 5월 23~25일에 걸쳐 일제히 보도했어. '반짝 세일'이 '구조적 가격 인하'로 바뀐 순간이야.

숫자로 보면 충격이 더 분명해져. V4-Pro는 이제 100만 토큰당 입력 약 0.435달러(캐시 미스)·캐시히트 0.003625달러·출력 0.87달러야. 기존 0.0145~3.48달러 구간과 비교하면 대략 4분의 1 수준으로 떨어진 거지. 출력 토큰 기준으로 GPT-5나 막 나온 제미나이 3.5 플래시 같은 서구 프런티어 모델과 견주면, 같은 작업을 몇 분의 일 비용으로 돌릴 수 있다는 얘기야.

타이밍이 의미심장해. V4(Pro 1.6T·Flash 284B, 1M 컨텍스트)는 불과 한 달 전인 4월 24일 프리뷰로 공개됐어. 보통 신모델은 출시 초기에 마진을 좀 챙기는데, 딥시크는 정반대로 갔어. 출시 한 달 만에 '점유율 > 단가'를 택한 거야. 토큰당 수익을 포기하더라도 개발자·기업을 자사 생태계로 빨아들이겠다는 신호지.

그리고 이게 단순한 '중국발 저가 공세' 이상의 함의를 가지는 이유가 있어. V4 계열은 딥시크가 화웨이 어센드(Ascend) 가속기에 최적화한 첫 모델군이거든. 미국의 대중 첨단 GPU 통제가 빡빡해지는 와중에, '국산 칩 + 저가 추론'이라는 조합이 실제로 작동하기 시작했다는 증거로 읽혀. 이게 이번 뉴스의 진짜 무게중심이야.

등장 인물 — 딥시크, 화웨이 어센드, 그리고 서구 프런티어

딥시크(DeepSeek). 2025년 초 R1으로 '저비용 추론 모델'의 대명사가 된 중국 AI 기업이야. 이번 V4-Pro 영구 인하는 그 정체성을 한 번 더 굳히는 수야. 딥시크의 전략은 일관돼 — 오픈웨이트와 공격적 가격으로 '비용'이라는 축에서 서구 빅랩과 정면 승부하는 거지. 프런티어 성능에서 격차가 있더라도, '충분히 좋은 모델을 압도적으로 싸게'라는 포지션을 파고든다.

화웨이 어센드(Huawei Ascend). 이번 가격 정책의 숨은 주인공이야. 보도에 따르면 어센드 950·950PR 슈퍼노드 시스템의 가용성이 늘면서, 딥시크가 저가를 '지속 가능'하게 유지할 자신감을 얻었다고 봐. 엔비디아 H100/H200에 의존하지 않고도 대규모 추론을 돌릴 인프라가 중국 안에서 갖춰지고 있다는 의미거든. 미국 제재가 역설적으로 중국 자체 AI 반도체 스택을 키우는 촉매가 된 셈이야.

서구 프런티어(오픈AI·구글·앤트로픽). 이들은 GPT-5, 제미나이 3.5, 클로드로 '성능 최전선'을 지키고 있어. 하지만 딥시크의 영구 저가는 이들의 가격·마진 구조에 직접적인 압박이야. 특히 '추론 비용이 곧 사업성'인 에이전트·코딩·대량 처리 영역에서, 고객이 "성능 차이가 이 가격 차이를 정당화하나?"를 묻기 시작하게 만들거든.

핵심 내용 — 무엇이, 얼마나 싸졌나

바뀐 것. 5월 31일 만료 예정이던 75% 할인이 무기한 영구화됐어. 핵심은 '한시'라는 단어가 사라졌다는 거야. 기업이 인프라를 V4-Pro 위에 올릴 때 가장 무서운 게 '할인 끝나면 비용 폭증'인데, 그 불확실성이 제거된 거지. 이제 V4-Pro의 저가는 '협상 카드'가 아니라 '기본값'이 됐어.

가격 구조. 100만 토큰당 입력 약 0.435달러(캐시 미스)·캐시히트 0.003625달러·출력 0.87달러. 특히 캐시히트가 0.003625달러로 극단적으로 싸. 반복 컨텍스트가 많은 RAG·에이전트 워크플로에선 실제 체감 비용이 더 떨어진다는 의미야. 1M 컨텍스트를 이 단가로 돌릴 수 있다는 건, '긴 문서 통째로 넣기'가 비용 부담 없이 일상화될 수 있다는 뜻이기도 해.

배경 인프라. V4는 어센드 최적화 첫 모델군이고, 어센드 950·950PR 슈퍼노드 확대가 저가의 토대로 지목돼. 즉 이번 인하는 '마케팅용 적자 세일'이 아니라 '원가 구조 자체가 내려간 결과'일 가능성이 커. 그게 사실이라면 서구 랩이 따라 내리기가 훨씬 어려워져 — 그쪽은 여전히 비싼 엔비디아 GPU 위에서 돌리니까.

항목 V4-Pro (영구 인하 후) 이전 가격 / 비교
입력(캐시 미스) ~$0.435 / 1M 이전 상단 대비 약 1/4
캐시히트 $0.003625 / 1M 반복 컨텍스트에 극단적 강점
출력 $0.87 / 1M 이전 $3.48 대비 약 1/4
컨텍스트 1M 토큰 V4 Pro 1.6T 파라미터
할인 성격 영구(정가화) 기존엔 5/31 만료 한시

경쟁 위치. 딥시크는 성능 1위를 노리는 게 아니야. '가성비'라는 축에서 시장을 재정의하려는 거지. GPT-5·제미나이 3.5 플래시가 성능에서 앞서더라도, 대량·반복 작업에선 "딥시크로 충분하고 훨씬 싸다"는 선택지가 강력해져.

각자의 이득

딥시크의 이득. 가장 직접적인 승자야. 점유율을 빠르게 늘리고, 개발자·기업을 자사 API에 락인할 토대를 깔았어. 토큰당 수익은 줄지만, 규모가 커지면 데이터·피드백·생태계라는 더 큰 자산이 쌓이거든. '저가 → 점유율 → 생태계 해자'라는 클래식한 플랫폼 플레이북이야.

화웨이의 이득. 어센드가 '실전에서 대규모 추론을 감당한다'는 레퍼런스를 얻었어. 딥시크의 저가가 어센드 인프라 위에서 가능하다는 게 입증되면, 다른 중국 AI 기업·정부 프로젝트가 어센드로 더 몰리게 돼. 미국 GPU 없이도 돌아가는 'AI 자립 스택'의 상업적 증거인 셈이야.

중국 AI 생태계의 이득. 저가 추론은 중국 내 스타트업·앱 개발자에게 '연료비 인하'야. AI 제품을 더 싸게, 더 많이 찍어낼 수 있게 되니까. 내수 AI 애플리케이션 폭증의 토대가 될 수 있어.

손해 보는 쪽. 서구 프런티어 랩의 마진과 가격 정책이 압박받아. 특히 '저렴한 플래시급 모델'로 대량 시장을 노리던 진영(제미나이 플래시, GPT 미니 계열)이 정면 충돌해. 그리고 딥시크 학습 데이터 출처 논쟁(과거 앤트로픽이 제기한 '증류' 의혹)이 다시 불거질 불씨도 남아 있어.

과거 유사 사례 — 성공과 실패

딥시크 R1 쇼크(2025 초). 딥시크가 저비용 추론으로 시장을 흔든 건 처음이 아니야. R1은 '훨씬 적은 비용으로 비슷한 성능'을 증명하며 엔비디아 주가까지 출렁이게 했지. 이번 V4-Pro 영구 인하는 그 전략의 2막이야 — 한 번의 충격이 아니라 '지속 가능한 저가'로 굳히려는 시도.

클라우드 가격 전쟁(AWS·GCP·Azure). 인프라 시장은 '단가 인하 → 점유율 확대 → 규모의 경제 → 추가 인하'의 나선을 반복해 왔어. 승자는 원가 구조를 진짜로 낮춘 쪽이었고, '마케팅 적자 세일'만 한 곳은 결국 후퇴했어. 딥시크의 인하가 어느 쪽인지가 관건인데, 어센드 기반이라면 전자일 가능성이 커.

무리한 저가의 함정. 반대 사례도 있어. 원가 우위 없이 점유율만 쫓아 가격을 던진 기업들은 현금이 마르며 무너졌어. 딥시크도 결국 '어센드 원가가 진짜 충분히 낮은가'에 성패가 달렸어. 만약 저가가 보조금·적자에 기댄 거라면, 이 전쟁은 오래 못 가.

경쟁자 카운터 플레이

오픈AI·구글. 정면 가격 인하로 맞불을 놓을 수도, '성능·신뢰·생태계' 차별화로 비켜갈 수도 있어. 가능성 높은 건 후자야 — 단가 경쟁에서 중국 어센드 원가를 이기긴 어려우니, 'GPT/제미나이는 더 똑똑하고 안전하고 통합돼 있다'는 가치를 강조하며 프리미엄을 지키려 할 거야. 동시에 플래시·미니급 라인은 일부 따라 내릴 여지도 있어.

앤트로픽. 가격보단 안전·신뢰·기업 거버넌스로 차별화하는 노선이야. 다만 딥시크의 저가가 코딩·에이전트 시장을 잠식하면 클로드 코드 같은 제품도 가격 압박을 느끼게 돼. 과거 제기한 '증류' 우려를 다시 들고 나와 '출처 불명 저가 모델'이라는 프레임으로 견제할 가능성도 있어.

엔비디아. 가장 미묘한 입장이야. 딥시크 저가가 어센드 위에서 가능해질수록, 중국 시장에서 엔비디아 GPU의 입지가 좁아지거든. 엔비디아는 '추론 수요 자체가 폭증하니 전체 파이가 커진다'는 논리로 방어하겠지만, 중국발 어센드 대안의 부상은 장기 리스크야.

서구 오픈웨이트 진영(메타 라마 등). 딥시크의 '오픈+저가' 조합에 가장 직접 노출돼. 라마 계열이 가격이 아니라 '온프레미스·커스터마이즈·라이선스'라는 다른 축으로 차별화를 강화할 유인이 커져.

그래서 뭐가 달라지는데 — 페르소나별

AI 개발자·스타트업. 추론 비용이 또 한 단계 내려갔어. 대량 처리·에이전트·RAG처럼 토큰을 많이 쓰는 제품이라면, V4-Pro로 단가를 확 낮추는 걸 진지하게 검토할 만해. 다만 데이터 거버넌스·지정학 리스크(중국 API 의존)도 같이 따져야 해. '싸다'가 전부는 아니거든.

기업 IT·구매 담당. 협상력이 세졌어. 'V4-Pro가 이 가격인데'라는 카드로 다른 벤더와의 협상에서 단가를 끌어내릴 수 있어. 단, 규제·데이터 주권 이슈로 중국 모델을 직접 못 쓰는 조직도 많으니, '벤치마크용 압박 카드'로 활용하는 게 현실적이야.

투자자. AI 추론은 '마진 압박 + 규모 경쟁'이 동시에 진행되는 시장이라는 게 더 분명해졌어. 프런티어 성능에 베팅할지, 비용 우위(칩·인프라)에 베팅할지 포지션을 분명히 해야 해. 화웨이 어센드 스택의 부상은 반도체 투자 지형에도 영향을 줘.

정책·안보 관계자. '미국 GPU 통제 → 중국 어센드 자립'이라는 역설이 현실화되고 있어. 제재가 단기엔 효과적이어도, 장기적으로 중국 내 대체 스택을 키우는 부작용을 어떻게 볼지 재평가가 필요해.

일반 사용자. 당장 체감은 적지만, 'AI를 쓰는 비용'이 전반적으로 계속 내려간다는 흐름의 한 장면이야. 더 많은 앱이 더 싸게 AI를 탑재하게 되고, 그만큼 AI가 일상에 더 깊이 스며들게 돼.

참고 자료

관련 기사

무료 뉴스레터

AI 트렌드를 앞서가세요

매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.

매일 30개+ 소스 분석 · 한국어/영어 이중 언어광고 없음 · 1-클릭 해지