spoonai
TOPVastTripoChina

29살 게이머가 만든 회사가 中 최신 AI 유니콘이 됐어 — Vast, 2억 달러로 텍스트→3D를 노린다

베이징의 3D 생성 AI 스타트업 Vast가 약 2억 달러를 유치하며 10억 달러+ 유니콘에 올랐어. 주력 제품 Tripo는 텍스트·이미지로 3D 모델을 뽑아내고, 개인 1,000만 명·기업 9만 곳이 써. 넷이즈 게임에도 기술을 공급하고, 알리바바·바이두가 투자자야.

·6분 소요·BloombergBloomberg
공유
Vast의 Tripo — 텍스트·이미지로 3D 모델을 생성하는 중국 AI 유니콘
출처: Tripo / VAST

텍스트 한 줄로 3D 모델을 뽑는 회사가 유니콘이 됐어

6월 1일, 블룸버그가 베이징 소재 3D 생성 AI 스타트업 Vast가 약 2억 달러를 유치하며 10억 달러 이상 가치의 '중국 최신 AI 유니콘'에 올랐다고 보도했어. 창업자는 29세, 게이머 출신이야. 게임을 하다가 '왜 3D 에셋 만드는 건 이렇게 어렵지?'라는 질문에서 출발한 회사가 몇 년 만에 조 단위는 아니어도 유니콘 반열에 오른 거지.

이게 흥미로운 이유는, 그동안 생성 AI의 스포트라이트가 텍스트(LLM)와 이미지·영상에 쏠려 있었기 때문이야. 3D는 게임·영화·메타버스·제조에 다 필요한데도 '만들기가 너무 어려운' 영역으로 남아 있었거든. 3D 모델 하나 만들려면 전문 아티스트가 며칠씩 매달려야 했어. Vast의 주력 제품 Tripo는 그 벽을 무너뜨려 — 텍스트나 이미지를 프롬프트로 넣으면 3D 모델이 나와. 그 '쉬워짐'에 자본이 몰린 거야.

주인공 소개 — Vast, Tripo, 그리고 창업자 Song

Vast는 2023년에 세워진 회사야. 창업자 Song은 센스타임(SenseTime) 출신 기술자들과 함께 회사를 차렸어. 센스타임은 중국의 대표적인 컴퓨터 비전·AI 기업이라, 거기서 나온 인재들이 3D 생성이라는 신생 분야에 뛰어든 거지. '게이머 출신 29세 창업자'라는 스토리가 화제지만, 그 뒤엔 탄탄한 비전 AI 기술 인력이 받치고 있어.

**Tripo(Studio)**는 Vast의 주력 제품이야. 텍스트("중세 갑옷을 입은 기사") 또는 이미지를 넣으면 그에 맞는 3D 모델을 생성해줘. 게임 개발자, 3D 아티스트, 제품 디자이너, 그리고 그냥 '3D 뭔가가 필요한' 일반 사용자까지 쓸 수 있어. 현재 개인 사용자 약 1,000만 명, 그리고 9만여 스튜디오·기업이 사용한다고 해. 이미 '실험용 장난감'이 아니라 실무 도구로 자리잡았다는 뜻이야.

투자자 명단도 화려해. 이번 라운드는 Ince Capital과 중국 차이나라이프(China Life Insurance) 계열 벤처펀드가 공동 리드했고, Genesis Capital, 그리고 기존 투자자 Eminence·Primavera가 참여했어. 거기에 중국 빅테크 알리바바와 바이두도 투자자로 이름을 올렸어. 빅테크가 직접 베팅했다는 건, 3D 생성이 단순 틈새가 아니라 전략적으로 중요한 영역이라는 신호야.

핵심 내용 — 숫자와 실제 적용 사례

핵심 수치를 표로 정리하면 이래.

항목 내용 비고
조달 규모 약 2억 달러 6월 1일 블룸버그 보도
기업가치 10억 달러+ 유니콘 등극
개인 사용자 약 1,000만 명 Tripo
기업·스튜디오 고객 약 9만 곳 Tripo
공동 리드 Ince Capital + 차이나라이프 계열 펀드 Genesis·Eminence·Primavera 참여
전략 투자자 알리바바, 바이두 중국 빅테크
창업 2023년 센스타임 출신 합류

숫자보다 더 인상적인 건 실제 적용 사례야. Vast는 넷이즈(NetEase)의 RPG '연운지문(Where Winds Meet)'에 기술을 공급해. 플레이어가 자기 사진을 올리면, 그 자리에서 인터랙티브한 3D 아바타가 생성되는 식이야. '텍스트→3D'가 연구실 데모가 아니라 수백만 명이 즐기는 게임 안에서 실제로 돌아간다는 거지. 이게 Tripo의 진짜 경쟁력이야 — 품질뿐 아니라 '실시간으로, 대규모로' 돌아가는 엔지니어링.

3D 생성이 어려운 이유는 이미지보다 차원이 하나 더 많기 때문이야. 2D 이미지는 픽셀 평면이지만, 3D는 형태(geometry), 텍스처, 그리고 게임·렌더링 엔진에서 쓸 수 있는 깔끔한 메시(mesh)까지 다 맞아떨어져야 해. Tripo가 1,000만 사용자를 모은 건 이 '실용성'의 벽을 어느 정도 넘었다는 뜻이고, 그래서 자본이 유니콘 가치를 매긴 거야.

각자의 이득 — Vast에게, 게임·제조 업계에게, 중국 AI 생태계에게

Vast에게 2억 달러는 'GPU 군비'와 '시장 선점'을 동시에 사는 돈이야. 3D 생성 모델은 학습에 막대한 컴퓨팅이 들고, 품질을 높이려면 데이터·연산을 계속 부어야 해. 이번 자금으로 모델 고도화와 글로벌 확장을 가속할 수 있고, 알리바바·바이두라는 빅테크 우군까지 얻어서 클라우드·유통에서도 유리한 고지를 점했어.

게임·제조·이커머스 업계에게는 '3D 에셋 제작 비용의 붕괴'라는 직접적 이득이 와. 게임 스튜디오는 캐릭터·소품·환경 에셋을 빠르게 찍어낼 수 있고, 이커머스는 제품의 3D 뷰를, 제조는 시제품 형상을 순식간에 만들 수 있어. 전문 3D 아티스트가 며칠 걸리던 작업이 분 단위로 줄면, 그동안 비용 때문에 3D를 포기했던 작은 팀들도 시장에 들어올 수 있어.

중국 AI 생태계에게는 '미국이 LLM·상업화에서 앞서는 동안, 우리는 생성 미디어·3D 같은 응용 영역에서 유니콘을 만든다'는 서사야. 며칠 전 해커뉴스에서 'AI 레이스의 진짜 척도가 상업화냐 응용이냐'를 두고 격론이 벌어졌는데, Vast 같은 사례는 중국이 응용·소비자 제품 쪽에서 빠르게 치고 나가는 흐름을 보여줘. 알리바바·바이두가 직접 투자한 것도 그 전략적 의도가 깔려 있고.

과거 유사 사례 — 생성 미디어 스타트업은 어떻게 됐나

생성 AI로 미디어 제작을 자동화하려는 시도는 여러 번 있었어. 그 궤적이 Vast의 앞날을 가늠하게 해줘.

성공 사례 — 이미지·영상 생성의 폭발. 미드저니, 런웨이 같은 회사들은 '텍스트→이미지/영상'으로 창작의 진입장벽을 무너뜨리며 빠르게 성장했어. 핵심은 '품질이 어느 임계점을 넘는 순간 사용자가 폭발한다'는 거였지. 교훈: 생성 미디어는 품질이 '쓸 만한 수준'을 넘으면 채택이 비선형적으로 튄다는 거고, Tripo의 1,000만 사용자는 3D가 그 임계점에 다가갔다는 신호야.

경계 사례 — '데모는 멋진데 실무엔 못 쓰는' 함정. 반면 초기 3D 생성 도구들은 데모 영상은 화려했지만, 실제로 게임 엔진에 넣으면 메시가 깨지거나 텍스처가 엉망이라 프로가 쓰기 어려운 경우가 많았어. 교훈: 3D는 '예쁜 결과'와 '실제로 파이프라인에 들어가는 결과'가 다르다는 거야. Vast가 넷이즈 게임에 실제 납품했다는 건 이 함정을 어느 정도 넘었다는 증거지만, 모든 용도에서 그런지는 더 검증이 필요해.

비교 사례 — 빅테크에 흡수되거나 가격 경쟁에 휩쓸리거나. 잘나가던 생성 미디어 스타트업들이 결국 빅테크의 자체 모델에 밀리거나 인수되는 경우도 많았어. 무료에 가까운 가격으로 비슷한 기능을 내놓는 거대 플랫폼 앞에서 독립 스타트업이 버티기는 쉽지 않거든. 교훈: 알리바바·바이두가 투자자이자 잠재적 경쟁자라는 점은 양날의 검이야. Vast가 '대체 불가능한 3D 품질·생태계'를 못 만들면, 빅테크 우군이 어느 순간 경쟁자로 바뀔 수 있어.

경쟁자 카운터 플레이

미국·서구의 3D 생성 스타트업은 '글로벌 게임·할리우드 파이프라인 통합'을 무기로 맞서. 이들은 언리얼·유니티 같은 주류 게임 엔진, 그리고 영화 VFX 워크플로우와의 매끄러운 연동을 강조해. Vast가 중국 내수 게임(넷이즈)에서 강하다면, 서구 경쟁자들은 '글로벌 AAA 게임·스튜디오 표준'에 파고드는 식으로 시장을 나눠 가지려 할 거야.

빅테크의 자체 3D 모델은 가장 큰 위협이야. 구글·메타·엔비디아 모두 3D·월드 생성에 투자하고 있고, 특히 엔비디아는 3D 콘텐츠·시뮬레이션의 하드웨어·소프트웨어 양쪽을 다 쥐고 있어. 이들이 무료·번들 형태로 3D 생성을 끼워 넣으면, 독립 스타트업의 가격 협상력은 약해져. Vast는 '특정 용도(게임 아바타·실시간 생성)에서의 압도적 전문성'으로 차별화해야 해.

전통 3D 에셋 마켓플레이스·아티스트는 다른 종류의 반발이야. 'AI가 뽑은 3D는 저작권·품질·일관성이 떨어진다'는 점을 강조하며, 프리미엄 시장은 여전히 사람 아티스트가 지킬 거라 주장해. 실제로 고품질·독창적 3D는 당분간 사람의 손이 필요하고, AI는 '대량·저가·빠른' 영역을 먼저 가져갈 가능성이 커.

그래서 뭐가 달라지는데

게임·앱 개발자에게는 '3D 에셋을 외주 주거나 직접 모델링하던 시대가 끝나간다'는 신호야. Tripo 같은 도구로 캐릭터·소품을 분 단위로 뽑아낼 수 있으면, 소규모 팀도 3D 콘텐츠가 풍부한 게임·앱을 만들 수 있어. 다만 'AI가 뽑은 메시가 실제 엔진에서 깔끔하게 도는지'는 용도별로 직접 검증해야 하고, 품질이 중요한 부분은 여전히 사람 손질이 필요할 거야.

창업자·투자자에게는 'LLM이 아닌 응용 생성 AI에도 유니콘이 나온다'는 점이 중요해. 텍스트 모델 경쟁은 빅테크의 자본 싸움이 됐지만, 3D·음성·아바타 같은 특정 modality에선 전문 스타트업이 빠르게 시장을 만들 수 있어. 중국에선 빅테크(알리바바·바이두)가 이런 스타트업에 직접 투자하는 패턴이 자리잡았고, 이게 '응용 AI 유니콘'을 빠르게 찍어내는 엔진이 되고 있어.

업계를 지켜보는 독자에게는 'AI 경쟁의 전선이 텍스트를 넘어 3D·공간·물리 세계로 넓어진다'는 큰 그림이 보여. 게임 속 아바타에서 시작했지만, 같은 기술이 결국 메타버스, 로봇 시뮬레이션, 디지털 트윈, 제조 설계로 번질 거야. 다만 블룸버그 보도 기준의 '약 2억 달러·유니콘'은 비공개 라운드라 정확한 가치·조건은 추후 공식 발표로 확인하는 게 맞아.

참고 자료

관련 기사

무료 뉴스레터

AI 트렌드를 앞서가세요

매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.

매일 30개+ 소스 분석 · 한국어/영어 이중 언어광고 없음 · 1-클릭 해지