Baseten이 15억 달러를 받고 5개월 만에 몸값을 3배로 키웠어 — '추론'이 AI의 새 전쟁터가 된 이유
AI 추론 인프라 회사 Baseten이 6월 22일 시리즈F로 15억 달러를 조달했어. 밸류에이션은 최대 130억 달러, 불과 5개월 만에 3배가 됐어. 하루 10억 건 넘는 추론을 처리하고 매출이 1년 새 20배 늘었어. 모델을 '훈련'하는 시대에서 '실제로 돌리는' 추론의 시대로 무게중심이 옮겨가는 신호야.

5개월 만에 몸값이 3배가 된 회사
자, 핵심부터. AI 추론 인프라 회사 Baseten이 6월 22일 시리즈F로 15억 달러(약 2조 원)를 조달했어. 밸류에이션은 최대 130억 달러인데, 진짜 놀라운 건 속도야 — 불과 5개월 전 대비 회사 가치가 3배로 뛰었어. 라운드는 Altimeter Capital, Conviction, Spark Capital이 주도했고, Sands Capital과 Wellington Management 등이 합류했어. 투자는 130억 달러와 110억 달러, 두 개의 트랜치로 나뉘어 들어왔어.
왜 이렇게 미친 속도로 몸값이 뛰었을까? 숫자를 보면 답이 나와. Baseten의 매출은 1년 새 약 20배 늘었고, 연환산 매출이 한 분기 만에 2억 달러에서 6억 달러로 점프했어. 지금 이 회사는 전 세계 18개 클라우드, 87개 클러스터에서 하루 10억 건이 넘는 추론 요청을 처리해. AI가 '실제로 돌아가는' 바로 그 지점을 장악하고 있는 거야.
그래서 오늘 풀 이야기는 이거야. Baseten이 뭘 하는 회사인지, '추론(inference)'이 왜 갑자기 AI의 새 전쟁터가 됐는지, 투자자들이 왜 이 속도로 베팅하는지, 그리고 이게 AI 산업의 무게중심이 어떻게 옮겨가는지를 보여주는지.
등장인물 — '훈련'이 아니라 '실행'을 파는 회사
먼저 Baseten. 2019년 투힌 스리바스타바(Tuhin Srivastava), 필립 하우스(Philip Howes), 아미르 하기갓(Amir Haghighat), 판카지 굽타(Pankaj Gupta)가 창업했어. 이 회사가 파는 건 AI 모델 자체가 아니라, 'AI 모델을 실제로 돌리는 데 필요한 소프트웨어와 컴퓨팅'이야. 특히 값싼 오픈소스 모델을 진지하게 쓰려면 그 주변에 탄탄한 인프라가 필요한데, Baseten이 그걸 깔아줘. 모델은 공짜여도, 그걸 빠르고 안정적으로 돌리는 건 또 다른 문제거든.
다음은 **'추론(inference)'**이라는 개념. AI에는 크게 두 단계가 있어. 하나는 모델을 만드는 '훈련(training)', 다른 하나는 만든 모델을 실제로 굴려서 답을 뽑는 '추론'이야. 지난 몇 년 AI 붐의 스포트라이트는 훈련에 쏠렸어 — 누가 더 큰 모델을 학습시키느냐의 경쟁이었지. 그런데 이제 모델이 충분히 좋아지고 실제 서비스에 깔리기 시작하니까, '그 모델을 매일 수십억 번 돌리는' 추론이 진짜 돈과 기술이 몰리는 곳이 됐어.
세 번째 주인공은 돈을 댄 투자자들. Altimeter, Conviction, Spark Capital은 테크 투자에서 안목으로 이름난 곳들이야. 이들이 5개월 만에 3배 오른 밸류에이션에 또 들어왔다는 건, '추론 인프라가 다음 10년의 핵심'이라는 확신이 있다는 뜻이야. 마치 2010년대에 클라우드 컴퓨팅이 그랬던 것처럼.
이 셋을 한 문장으로 묶으면 이래. AI 모델을 '실제로 돌리는' 추론 인프라를 파는 Baseten이, 매출 20배 성장과 하루 10억 건 처리를 무기로, 5개월 만에 몸값을 3배 키우며 15억 달러를 받았다. 이게 뼈대야.
핵심 내용 — 숫자로 보는 Baseten
말로 풀면 흩어지니까, 확인된 사실을 표로 보자.
| 항목 | 내용 |
|---|---|
| 라운드 | 시리즈F, 15억 달러 |
| 발표일 | 2026년 6월 22일 |
| 밸류에이션 | 최대 130억 달러 (130억·110억 두 트랜치) |
| 밸류 변화 | 5개월 만에 3배 |
| 주도 투자자 | Altimeter, Conviction, Spark Capital |
| 추가 참여 | Sands Capital, Wellington Management 등 |
| 매출 성장 | 전년 대비 약 20배 |
| 연환산 매출 | 한 분기 만에 2억 → 6억 달러 |
| 처리량 | 하루 10억 건 이상 추론 |
| 인프라 | 18개 클라우드, 87개 클러스터 |
| 창업 | 2019년 (투힌 스리바스타바 외 3인) |
| 자금 용도 | 인재 3배 증원, 컴퓨팅 확장, 기업 영업 |
표를 한 줄씩 보자. 우선 **'5개월 만에 3배'**라는 속도가 핵심이야. 보통 회사 가치가 3배 오르는 데는 몇 년이 걸려. Baseten이 5개월 만에 그걸 해냈다는 건, AI 추론 수요가 그만큼 폭발적으로 늘고 있다는 신호야. 투자자들이 '비싸도 지금 안 들어가면 더 비싸진다'고 판단했다는 뜻이지.
두 번째로 **'연환산 매출 2억 → 6억 달러, 한 분기 만에'**가 어마어마해. 분기 하나 만에 매출 페이스가 3배가 됐어. 이건 단순 성장이 아니라 가속이야. AI 서비스들이 실제로 깔리면서, 그 뒤에서 모델을 돌려주는 Baseten 같은 회사로 돈이 쏟아져 들어오고 있다는 증거야.
세 번째로 **'하루 10억 건, 18개 클라우드, 87개 클러스터'**라는 규모가 의미심장해. 이건 Baseten이 특정 클라우드에 묶이지 않고, 전 세계 어디서든 가장 효율적인 곳에서 추론을 돌릴 수 있다는 뜻이야. AI 회사들 입장에선 '우리가 직접 인프라를 깔 필요 없이 Baseten에 맡기면 된다'는 거고, 그게 곧 Baseten의 해자야.
각자의 이득 — 누가 뭘 얻나
Baseten의 이득부터 보자. 첫째, 압도적 실탄. 15억 달러로 인재를 올해 3배로 늘리고, 컴퓨팅을 대규모로 확장하고, 기업 영업을 강화할 수 있어. 둘째, 시장 선점이야. 추론 인프라 경쟁이 본격화되는 바로 지금, 거액을 확보해 경쟁사보다 앞서 규모를 키우는 거지. 셋째, 신뢰의 도장. Altimeter·Wellington 같은 큰손이 들어왔다는 건, 대기업 고객을 끌어들이는 영업에서 강력한 명함이 돼.
투자자들의 이득도 분명해. 추론은 AI가 돈을 버는 '마지막 1마일'이야. 모델을 아무리 잘 만들어도 결국 사용자에게 답을 내주려면 추론을 돌려야 하고, 그 트래픽은 AI가 퍼질수록 무한히 늘어. 투자자들은 '추론이 2010년대 클라우드 같은 카테고리 정의 인프라가 된다'고 보고, 그 인프라의 선두주자에 베팅한 거야. 맞으면 10년짜리 거대 수익이지.
그리고 의외의 수혜자는 AI 스타트업 생태계 전체야. Baseten 같은 회사가 추론을 싸고 빠르게 돌려주면, 자본이 적은 스타트업도 비싼 자체 인프라 없이 AI 서비스를 만들 수 있어. 특히 값싼 오픈소스 모델 + Baseten의 인프라 조합은, 'OpenAI·구글의 비싼 API에만 의존하지 않아도 된다'는 대안을 열어줘. 추론 인프라의 발전이 AI 진입장벽을 낮추는 거야.
과거 유사 사례 — 성공과 실패
추론 인프라의 부상은 '골드러시에서 곡괭이를 파는' 고전 패턴이야. 금광이 터지면 금을 캐는 사람보다 곡괭이·청바지를 파는 사람이 안정적으로 돈을 번다는 그 얘기. AI 붐에서 모델(금)을 만드는 건 OpenAI·구글 같은 거인들의 피 튀기는 싸움이지만, 그 모델을 돌리는 인프라(곡괭이)를 파는 Baseten은 '누가 이기든' 트래픽이 늘면 돈을 벌어. 안정적인 위치지.
가장 가까운 성공 비유는 2010년대의 클라우드 컴퓨팅이야. 클라우드가 처음 떴을 때도 '서버를 직접 사느니 빌려 쓴다'는 발상이 산업을 바꿨고, 그 인프라를 깐 회사들이 거대 기업이 됐어. 추론도 똑같은 길을 갈 수 있어 — 'AI 모델 돌리는 컴퓨팅을 직접 사느니 Baseten에 맡긴다'가 표준이 되면, Baseten은 그 시대의 핵심 인프라가 돼.
반대로 실패의 그림자도 있어. **'인프라는 결국 가격 경쟁에 빠진다'**는 위험이야. 추론을 돌려주는 일은 본질적으로 컴퓨팅 장사라, 경쟁사가 많아지면 가격이 깎여 마진이 얇아질 수 있어. 게다가 거대 클라우드(AWS·구글·MS)가 직접 추론 서비스를 강화하면, Baseten 같은 독립 회사는 끼인 신세가 될 수도 있어. 130억 달러 밸류에이션은 '추론 수요가 계속 폭발하고, Baseten이 그 마진을 지킨다'는 두 가정에 기대고 있어.
경쟁자 카운터 플레이
가장 큰 위협은 거대 클라우드들이야. AWS, 구글 클라우드, 마이크로소프트 애저는 이미 자체 AI 추론 서비스를 갖고 있고, 자기 고객을 그쪽으로 묶으려 해. 이들의 카운터는 '굳이 Baseten 안 써도 우리 클라우드 안에서 다 된다'는 거지. Baseten의 방어 논리는 '우리는 특정 클라우드에 안 묶이고, 18개 클라우드를 넘나들며 가장 싸고 빠른 곳에서 돌린다'는 중립성과 최적화야.
다른 추론 전문 스타트업·칩 회사들도 카운터 플레이를 짜. 오늘 함께 주목받는 d-Matrix 같은 추론 전용 칩 회사나, 다른 추론 플랫폼들은 '우리가 더 빠르다/싸다'로 경쟁해. 추론 시장이 워낙 커지니까, 소프트웨어 플랫폼(Baseten)부터 전용 하드웨어(칩)까지 층층이 경쟁자가 생겨. Baseten은 '하드웨어 중립 + 소프트웨어 최적화'라는 자기 자리를 지켜야 해.
모델 회사들의 수직 통합도 변수야. OpenAI·Anthropic 같은 모델 회사가 '우리 모델은 우리 인프라에서 가장 잘 돌아간다'며 추론까지 직접 가져가면, Baseten의 시장이 줄어들 수 있어. 다만 값싼 오픈소스 모델을 쓰는 수많은 회사들에겐 여전히 Baseten 같은 중립 인프라가 필요하니, 시장이 통째로 사라지진 않아.
그래서 뭐가 달라지는데
AI 서비스를 만드는 개발자·창업자라면 Baseten의 성장은 좋은 소식이야. 추론 인프라가 발전하고 경쟁이 붙을수록, 너는 더 싸고 빠르게 AI를 서비스에 얹을 수 있어. 특히 오픈소스 모델 + 추론 플랫폼 조합은 비싼 API 의존을 줄여주는 현실적 대안이야. 어떤 추론 플랫폼이 가격·속도·안정성에서 유리한지 비교해볼 만한 시점이야.
AI 투자·산업을 보는 입장이라면 이건 '무게중심 이동'의 신호야. 그동안 돈과 관심은 '누가 더 좋은 모델을 만드나'(훈련)에 쏠렸는데, 이제 '그 모델을 어떻게 싸고 빠르게 돌리나'(추론)로 옮겨가고 있어. 모델 성능이 상향 평준화될수록, 차별화는 추론 효율과 비용에서 나와. Baseten의 15억 달러는 그 전환을 보여주는 가장 선명한 장면이야.
일반 사용자라면 직접 체감은 적지만, 간접 효과는 있어. 추론 인프라가 싸지고 빨라지면, 네가 쓰는 AI 서비스의 응답이 빨라지고 가격이 내려갈 여지가 생겨. 'AI가 점점 싸고 빨라지는' 흐름의 뒤에는 Baseten 같은 추론 회사들의 경쟁이 깔려 있어.
한 걸음 더 — 왜 지금 '추론'인가
이 딜을 제대로 읽으려면, AI 산업의 단계 변화를 봐야 해. 지난 몇 년은 '모델 군비 경쟁'의 시대였어. 더 크고 똑똑한 모델을 만드는 데 모든 돈과 인재가 쏠렸지. 그런데 모델이 충분히 좋아지고 실제 제품에 깔리기 시작하면서, 게임의 무게중심이 옮겨가고 있어. 이제 중요한 질문은 '누가 가장 똑똑한 모델을 만드나'가 아니라 '그 모델을 매일 수십억 번 돌리는 비용을 누가 가장 낮추나'가 됐어. 추론은 AI가 실제로 돈을 쓰고 버는 곳이고, 그래서 Baseten 같은 회사로 자본이 몰리는 거야.
또 하나 놓치기 쉬운 맥락은 '오픈소스 모델의 부상'이야. 값싼(혹은 공짜) 오픈소스 모델이 점점 좋아지면서, 많은 회사가 비싼 폐쇄 API 대신 오픈소스를 자체 인프라에서 돌리려 해. 문제는 오픈소스 모델을 빠르고 안정적으로 돌리는 게 기술적으로 어렵다는 거야. Baseten은 정확히 그 틈을 메워 — '오픈소스 모델, 우리가 잘 돌려줄게'. 매출 20배 성장의 상당 부분이 여기서 나와. 오픈소스의 부상과 추론 인프라의 부상은 한 몸인 거지.
다만 냉정하게 볼 변수도 분명해. 첫째, 거대 클라우드의 압박이야. AWS·구글·MS가 추론을 자기 플랫폼에 강하게 묶으면, 독립 회사 Baseten은 끼일 수 있어. 둘째, 가격 경쟁이야. 컴퓨팅 장사는 결국 마진이 깎이기 쉬워서, 130억 달러 밸류에이션을 정당화하려면 단순 가격이 아닌 '최적화 기술'로 차별화해야 해. 셋째, AI 거품론이야. 지금 AI 인프라에 들어가는 천문학적 자본이 모두 회수될지는 아무도 장담 못 해 — 추론 수요가 기대만큼 안 늘면, 이 밸류에이션은 무거운 청구서가 될 수 있어.
결국 Baseten의 15억 달러는 단순 펀딩 뉴스가 아니라, AI 산업이 '모델을 만드는 시대'에서 '모델을 돌리는 시대'로 넘어가는 변곡점을 보여주는 좌표야. 곡괭이를 파는 자의 시간이 온 거지. 그 시간이 클라우드처럼 거대한 인프라 제국을 낳을지, 아니면 가격 경쟁에 마진이 녹는 레드오션이 될지는, 앞으로 몇 년 추론 수요가 답할 문제야.
🥄 남은 궁금증 세 가지
— '추론'이 정확히 뭔데 그게 그렇게 중요해? 모델을 만드는 게 '훈련'이고, 만든 모델을 실제로 돌려 답을 뽑는 게 '추론'이야. AI 서비스가 깔릴수록 추론은 매일 수십억 번 일어나고, 거기서 비용과 돈이 갈려. 모델 성능이 비슷해질수록 '얼마나 싸고 빠르게 돌리나'가 승부처가 돼.
— 5개월 만에 3배면 거품 아냐? 빠른 건 맞아. 다만 매출이 실제로 20배 늘고 분기마다 가속하고 있다는 점에서, 숫자에 근거가 있긴 해. 그래도 거대 클라우드 압박과 가격 경쟁이라는 리스크는 남아. 거품인지 선점인지는 단정하긴 일러.
— 나 같은 사람한테 영향 있어? 간접적으로는 있어. 추론 인프라가 싸고 빨라지면 네가 쓰는 AI 서비스의 응답이 빨라지고 가격이 내려갈 여지가 생겨. 개발자라면 비싼 API 대신 오픈소스+추론 플랫폼 조합을 고려해볼 만해.
참고 자료
- Baseten Raises $1.5 Billion to Power the Next Era of AI Inference — BusinessWire
- Baseten Raises $1.5B Series F — The SaaS News
- Baseten raises $1.5 billion at a $13 billion valuation as inference becomes AI's most contested infrastructure layer — Startup Fortune
- Baseten Raises $1.5 Billion Series F at Up to $13 Billion Valuation — citybiz
- Baseten raises $1.5B at $13B valuation in AI inference boom — MasterNodeAI
숫자와 기준은 발표 시점 기준이라 바뀔 수 있어. 투자 판단은 각자의 몫!
출처
- Baseten Raises $1.5 Billion to Power the Next Era of AI Inference — BusinessWire
- Baseten Raises $1.5B Series F — The SaaS News
- Baseten raises $1.5 billion at a $13 billion valuation as inference becomes AI's most contested infrastructure layer — Startup Fortune
- Baseten Raises $1.5 Billion Series F at Up to $13 Billion Valuation — citybiz
관련 기사
AI 트렌드를 앞서가세요
매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.
