spoonai
TOPOpenAIBroadcomAI칩

OpenAI가 첫 자체 칩 '할라페뇨'를 9개월 만에 만들었어 — AI가 AI 칩을 설계한 셈

6월 24일 OpenAI와 Broadcom이 LLM 추론 전용 칩 '할라페뇨'를 공개했어. 구상에서 테이프아웃까지 단 9개월, 업계 최단 기록. 설계엔 OpenAI 자체 모델이 동원됐고, 연말부터 기가와트급 데이터센터에 배포돼.

·7분 소요
공유
AI 데이터센터 GPU 서버랙
Unsplash

칩 하나 만드는 데 보통 몇 년인데, 9개월 만에 끝냈어

자, 핵심부터 말할게. OpenAI와 Broadcom이 6월 24일 첫 자체 AI 칩 '할라페뇨(Jalapeño)'를 공개했어. ChatGPT 같은 LLM의 추론(inference) — 이미 학습된 모델이 사용자 명령에 응답하는 과정 — 만 전담하도록 처음부터 설계한 맞춤형 칩이야. OpenAI는 이걸 자기네 첫 '인텔리전스 프로세서'라고 불렀어.

가장 충격적인 건 속도야. 구상에서 제조 테이프아웃까지 단 9개월. 보통 고성능 첨단 반도체는 설계부터 양산 직전까지 2~3년은 걸려. 그걸 9개월에 끝낸 건 "고성능 첨단 반도체 역사상 가장 빠른 ASIC 개발 사이클로 추정된다"는 평가를 받았어. 그리고 그걸 가능하게 한 비결이 흥미로워 — OpenAI 자체 모델이 칩 설계와 최적화 과정 일부를 가속하는 데 쓰였어. 즉 AI가 AI 칩을 만드는 데 일조한 거지. SF 같은 얘기지만 실제로 일어난 일이야.

칩은 추론 전용이야. 학습(training)이 아니라, 이미 만들어진 모델을 빠르고 싸게 돌리는 데 특화됐어. OpenAI는 자기네 모델의 작동 원리, 커널, 서빙 시스템, 제품 수요를 깊이 이해한 상태에서 칩을 백지에서 설계했고, Broadcom과 Celestica가 그걸 양산 가능한 플랫폼으로 산업화했어. 초기 테스트에서 와트당 성능이 현세대 최고 수준보다 '상당히' 낫다고 밝혔고, 연말부터 단계적으로 배포돼.

오늘 풀 이야기는 이거야. 왜 OpenAI가 직접 칩을 만들었는지, 9개월이라는 속도가 뭘 의미하는지, 그리고 Nvidia·개발자·AI 업계 전체에 뭐가 달라지는지. 등장인물은 셋이야 — 칩을 설계한 OpenAI, 실리콘을 구현한 Broadcom, 그리고 이 칩이 정조준한 Nvidia.

등장인물 — OpenAI, Broadcom, 그리고 Nvidia

먼저 OpenAI. ChatGPT 수요가 폭발하면서 추론 비용이 회사 재무의 최대 변수가 됐어. 모델을 한 번 굴릴 때마다 GPU가 돌고, 그 GPU는 대부분 Nvidia 거야. 즉 OpenAI는 매출이 늘수록 Nvidia에 내는 돈도 늘어나는 구조에 묶여 있었어. 자체 칩은 이 종속에서 벗어나고, 추론 단가를 자기 손으로 통제하려는 시도야. 2025년 10월 Broadcom과 맺은 협력의 첫 구체적 산출물이기도 해.

다음은 Broadcom. 맞춤형 칩(ASIC) 설계·구현에서 손꼽히는 회사야. 구글의 TPU도 사실 Broadcom의 도움으로 만들어졌지. OpenAI가 '무엇을 만들지'를 정하면, Broadcom이 '어떻게 실리콘으로 구현할지'를 책임지는 분업 구조야. 이번 협력으로 Broadcom은 'AI 빅테크의 자체 칩 파트너'라는 포지션을 더 굳혔어.

세 번째는 Nvidia. 직접 등장하진 않지만 이 칩이 가장 신경 쓰이는 회사야. 할라페뇨의 목표는 Nvidia GPU 대비 추론 비용 절감이거든. AI 추론 시장은 학습 시장보다 훨씬 크고 계속 커지는데, 그 시장을 Nvidia GPU가 거의 독점해 왔어. OpenAI 같은 최대 고객이 자체 칩으로 일부를 대체하면, Nvidia의 가장 큰 매출원이 흔들릴 수 있어.

이 셋을 한 문장으로 묶으면 이래. OpenAI는 추론 비용과 Nvidia 종속에서 벗어나려 자체 칩을 만들었고, Broadcom이 그걸 9개월 만에 실리콘으로 찍어냈다. 이게 뼈대야.

핵심 내용 — 숫자로 보면 이래

항목 내용
칩 이름 할라페뇨(Jalapeño)
용도 LLM 추론 전용 ASIC
개발 기간 구상→테이프아웃 9개월 (업계 최단 추정)
설계 보조 OpenAI 자체 모델로 설계·최적화 가속
성능 와트당 성능 현세대 최고 대비 '상당히' 우수
배포 2026년 말부터 기가와트급 데이터센터
파트너 Broadcom(실리콘), Celestica(산업화)

표에서 두 가지가 눈에 띄어. 첫째, '추론 전용'이라는 게 핵심이야. 학습과 추론은 요구하는 연산이 달라. 학습은 유연성이 중요해 범용 GPU가 유리하지만, 추론은 같은 연산을 대량 반복해서 '특화 칩'으로 효율을 극대화할 수 있어. OpenAI는 자기 모델이 정확히 어떤 연산을 하는지 아니까, 거기에 딱 맞춘 칩으로 와트당 성능을 끌어올린 거야.

둘째, 9개월이라는 속도가 진짜 뉴스야. 칩 설계는 사람이 일일이 회로를 배치하고 검증하는 어마어마한 작업인데, OpenAI 모델이 그 EDA(전자 설계 자동화) 과정을 가속했다고 해. 이게 의미하는 바는 커 — AI가 칩 설계를 도우면 칩이 더 빨리 나오고, 그 칩이 다시 더 강한 AI를 굴리고, 그 AI가 또 다음 칩을 설계하는 '되먹임 고리'가 현실이 됐다는 거지. 반도체 개발의 속도 자체가 달라질 수 있다는 신호야.

각자의 이득 — 누가 웃나

OpenAI가 가장 크게 웃어. 추론 단가를 자기 손으로 통제하게 되면, 매출이 늘수록 비용도 비례해 늘던 구조에서 벗어날 수 있어. 마진이 개선되고, Nvidia 공급·가격 변동에 덜 휘둘려. 게다가 '우리는 칩까지 직접 만든다'는 건 기술 자립도와 기업 가치 서사 모두에 큰 플러스야. IPO를 향해 가는 길에서 강력한 카드지.

Broadcom도 확실한 수혜자야. AI 빅테크들이 줄줄이 자체 칩으로 가는 흐름에서, 그 설계·구현을 받쳐줄 파트너로서 입지가 커졌어. OpenAI라는 초대형 레퍼런스를 얻은 셈이고, 다른 AI 회사들의 자체 칩 수요까지 끌어올 수 있어.

곤란해진 쪽은 당연히 Nvidia야. 다만 너무 단순화하진 말자. 할라페뇨는 '추론 전용'이고, 학습 시장과 범용 GPU 수요는 여전히 Nvidia가 압도해. 또 자체 칩을 만들 여력이 있는 회사는 극소수야. 그래도 '최대 고객의 이탈 가능성'이라는 상징성은 무겁고, 추론 시장의 일부를 잠식당하는 건 분명한 압박이야.

과거 유사 사례 — 성공과 실패

비슷한 장면을 우리는 이미 봤어. 구글의 TPU, 아마존의 Trainium·Inferentia, 애플의 자체 실리콘이 대표적이야. 거대 테크는 핵심 연산이 일정 규모를 넘으면 '직접 칩을 만드는 게 싸다'는 결론에 도달해. 구글이 TPU로 검색·AI 비용을 통제했듯, OpenAI도 같은 길을 걷는 거야. 이 전략은 충분한 물량이 보장될 때 강력해.

성공의 핵심은 '규모'야. 자체 칩은 개발비가 천문학적이라, 그 칩을 충분히 많이 돌려야 본전을 뽑아. OpenAI는 ChatGPT라는 거대한 자체 수요가 있으니 그 조건을 만족해. 반대로 실패의 위험도 분명해. 칩 개발은 한 번 삐끗하면 수율·전력·소프트웨어 스택 문제로 양산이 늦어지고, 그 사이 GPU는 또 한 세대 발전해버려. '따라잡았다 싶으면 이미 추월당한' 상황이 반복될 수 있어.

또 하나의 교훈은 '소프트웨어'야. Nvidia의 진짜 해자는 칩이 아니라 CUDA 같은 소프트웨어 생태계라는 분석이 많아. 자체 칩이 빨라도, 그 위에서 모델을 돌리는 소프트웨어 스택이 무르익지 않으면 실전 효율이 안 나와. OpenAI가 칩과 서빙 소프트웨어를 함께 설계한 건 바로 이 함정을 피하려는 거야.

이 발표에 묶인 두 가지 베팅을 구분하면 이해가 쉬워. 하나는 뻔한 거 — 더 싼 추론이야. 다른 하나는 더 조용한 베팅인데, '전략적 선택지(optionality)'야. 칩 설계를 직접 보유하면 OpenAI는 앞으로 Nvidia, 클라우드 사업자, 자본 시장과의 모든 협상에서 지렛대를 얻어. 할라페뇨가 추론의 일부만 처리하더라도, 그 존재 자체가 협상 테이블을 바꿔 — "우리도 직접 만들 수 있다"는 "당신한테 전적으로 의존한다"와 전혀 다른 입장이거든. 구글의 TPU도 순수 실리콘 가치만큼이나 Nvidia를 상대로 한 '협상 카드'로서 가치가 컸다는 평가가 많아. OpenAI는 그 똑같은 선택지를 산 거고, 9개월은 그걸 얼마나 빨리 샀는지를 보여주는 숫자야.

경쟁자 카운터 플레이 — 다음 수는

Nvidia의 카운터는 '추론 특화 제품 강화'와 '소프트웨어 락인'이야. 추론에 최적화된 GPU 라인을 더 공격적으로 내고, CUDA 생태계의 편의성으로 고객 이탈을 막는 거지. 또 가격·공급 조건을 유연하게 가져가 대형 고객의 자체 칩 유인을 줄일 수도 있어. "직접 만드는 것보다 우리 걸 쓰는 게 결국 싸다"를 증명하려 할 거야.

구글·아마존 같은 자체 칩 선배들은 이 흐름을 반길 거야. "거봐, 자체 칩이 맞는 방향이지"라는 검증이 강화되니까. 동시에 OpenAI가 경쟁자로 칩 시장에 들어온 셈이라, 클라우드·인프라 경쟁은 더 복잡해져.

**다른 AI 랩들(Anthropic 등)**은 선택의 기로에 서. 자체 칩을 만들 만큼 물량이 되는지, 아니면 GPU·외부 칩을 계속 쓸지. OpenAI가 9개월 만에 칩을 찍어낸 게 보여준 건, '자체 칩의 진입 장벽이 생각보다 낮아질 수 있다'는 거야. 이게 사실이라면 더 많은 회사가 자체 칩에 뛰어들 명분이 생겨.

그래서 뭐가 달라지는데

개발자라면 — 당장 너의 코드가 바뀌진 않아. 할라페뇨는 OpenAI 내부 인프라용이라, API 사용자는 칩이 뭐든 똑같이 OpenAI API를 부르면 돼. 다만 중장기적으로 추론 단가가 내려가면, 그 절감분이 API 가격 인하로 이어질 가능성이 있어. GPT-5.6의 공격적 가격(특히 Luna $1/$6)도 이런 원가 구조 변화와 무관하지 않아.

투자자라면 — AI 칩 시장의 구도가 'Nvidia 독점'에서 '자체 칩 분산'으로 천천히 이동하는 신호야. Broadcom 같은 ASIC 파트너, 그리고 추론 특화 반도체 밸류체인이 주목받을 수 있어. 다만 Nvidia의 해자(소프트웨어·범용성·학습 시장)는 여전히 깊다는 점도 균형 있게 봐야 해.

AI 업계 종사자라면 — 'AI가 칩을 설계하는' 되먹임 고리가 현실이 됐다는 게 가장 큰 시사점이야. 이게 가속되면 하드웨어 발전 속도 자체가 빨라지고, 그건 모델 발전 속도에도 영향을 줘. 반도체와 AI의 경계가 점점 흐려지는 시대로 가고 있어.

🥄 남은 궁금증 세 가지

— 이제 OpenAI는 Nvidia 안 써? 아니야, 그렇게 단순하지 않아. 할라페뇨는 추론 전용이고, 학습엔 여전히 GPU가 필요해. 그리고 자체 칩 배포는 연말부터 단계적이라, 당분간은 Nvidia GPU와 자체 칩을 병행해. 완전 대체가 아니라 '일부 추론을 자체 칩으로 옮기는' 그림이야.

— 9개월이면 칩 만드는 게 쉬워진 거야? 오해는 말자. OpenAI는 자체 모델·막대한 자본·Broadcom·Celestica라는 최강 조합이 있었어. 일반 회사가 9개월에 칩을 찍을 수 있다는 뜻은 아니야. 다만 'AI가 설계를 가속한다'는 방법론이 검증됐다는 점에서, 개발 속도의 천장이 올라간 건 맞아.

— Nvidia 주식 이제 끝난 거야? 단정하긴 일러. 추론 일부를 잠식당하는 압박은 분명하지만, 학습 시장·CUDA 생태계·범용성이라는 해자는 여전히 깊어. '독점이 흔들리는 신호'와 '몰락'은 전혀 다른 얘기야. 시장 구조 변화는 보통 몇 년에 걸쳐 천천히 일어나.

참고 자료

수치는 발표 시점 기준이라 바뀔 수 있어.

관련 기사

무료 뉴스레터

AI 트렌드를 앞서가세요

매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.

매일 30개+ 소스 분석 · 한국어/영어 이중 언어광고 없음 · 1-클릭 해지