OpenAI, 첫 자체 칩 'Jalapeño'를 9개월 만에 찍었다 — 엔비디아 의존을 끊는 한 수
OpenAI가 Broadcom과 함께 만든 첫 자체 AI 추론 칩 'Jalapeño'를 공개했어. 설계 착수부터 테이프아웃까지 단 9개월, 업계에서 손꼽히는 초고속 ASIC 개발이야. LLM 추론만을 위해 백지에서 새로 그린 칩이고, 2026년 말부터 기가와트급 데이터센터에 깔리기 시작해. 엔비디아 GPU 의존을 줄이려는 OpenAI의 가장 구체적인 한 수야.

'GPU를 빌려 쓰던 OpenAI'가, 드디어 자기 칩을 찍었다
자, 핵심부터. OpenAI가 6월 24일, Broadcom과 함께 만든 첫 자체 AI 추론 칩 'Jalapeño(할라페뇨)'를 공개했어. 이름값 하는 매운 한 방이야. 그동안 OpenAI는 ChatGPT든 Codex든 전부 엔비디아 GPU 위에서 굴려 왔는데, 이제 'OpenAI가 직접 설계한, OpenAI 모델만을 위한 칩'이 실물로 나온 거야.
가장 충격적인 숫자는 성능이 아니라 속도야. 설계 착수부터 제조 테이프아웃(설계를 공장에 넘기는 단계)까지 걸린 시간이 단 9개월. 고성능 반도체에서 새 칩 하나를 처음부터 양산 직전까지 끌고 가는 데 보통 2~3년이 걸리는 걸 생각하면, 이건 업계에서 손꼽히는 초고속 개발 사이클이야. 그것도 거대한 레티클 크기(reticle-sized)의 본격 ASIC을 말이지.
왜 이게 큰 뉴스냐. 두 가지 흐름이 겹치기 때문이야. 첫째, AI 업계 최대의 병목이 '모델'에서 '컴퓨트'로 넘어왔어. 누가 더 싸고 빠르게 추론을 돌리느냐가 곧 돈이 되는 시대야. 둘째, 그 컴퓨트를 사실상 엔비디아 한 곳이 쥐고 있었어. OpenAI가 자기 칩을 찍었다는 건, '모델 회사'에서 '인프라까지 직접 짓는 회사'로 한 발 더 내려갔다는 신호고, 동시에 엔비디아 독점에 균열을 내는 첫 망치질이야.
그래서 오늘 풀 이야기는 이거야. Jalapeño가 정확히 뭔지, OpenAI와 Broadcom이 각각 뭘 얻는지, 9개월이라는 속도가 어떻게 가능했는지, 그리고 이게 엔비디아·구글·아마존이 짜놓은 칩 판도에 뭘 던지는지. 등장인물 셋만 잡으면 그림이 잡혀.
등장인물 — OpenAI, Broadcom, 그리고 칩 'Jalapeño'
먼저 OpenAI. 더 설명이 필요 없는 ChatGPT의 회사지. 핵심은 OpenAI의 고민이 바뀌었다는 거야. 예전엔 '더 똑똑한 모델'이 목표였다면, 지금은 '그 모델을 어떻게 싸고 안정적으로 수억 명에게 돌리느냐'가 진짜 전쟁터야. 추론(inference) 비용이 회사 손익을 좌우하고, GPU 물량 확보가 곧 사업 속도가 되는 구조에서, 남의 칩만 빌려 쓰는 건 약점이었어.
다음은 Broadcom. 일반 소비자에겐 낯설지만 반도체 업계의 진짜 강자야. 직접 칩을 파는 것보다, 거대 고객이 '우리만의 맞춤 칩'을 원할 때 그 설계와 양산을 대신 해주는 커스텀 실리콘(ASIC) 사업이 핵심이야. 구글의 TPU 일부도 Broadcom의 손을 거쳤다고 알려져 있어. 이번 Jalapeño는 Broadcom이 OpenAI라는 초대형 고객을 정식으로 손에 쥐었다는 선언이기도 해.
세 번째는 오늘의 주인공 Jalapeño. OpenAI가 부르는 정식 명칭은 'Intelligence Processor', 즉 지능 처리기야. 핵심은 이게 'GPU를 AI용으로 개조한 물건'이 아니라는 점이야. 현대 LLM 추론에서 진짜 중요한 것들 — 커널 연산, 메모리 이동, 네트워킹, 서빙 패턴 — 만을 겨냥해 백지(blank-slate)에서 새로 그린 추론 전용 칩이야. 학습(training)이 아니라 오직 추론에 특화됐다는 게 포인트고.
이 셋의 관계를 한 문장으로 묶으면 이래. 모델을 가장 많이 굴려본 회사(OpenAI)가, 커스텀 칩을 가장 잘 찍는 회사(Broadcom)와 손잡고, 자기 모델의 실전 데이터로 설계한 추론 전용 칩(Jalapeño)을 9개월 만에 찍어냈다. 이게 이야기의 뼈대야.
핵심 내용 — 무엇이 공개됐나
말로 풀면 흩어지니까, 확인된 사실을 표로 보자.
| 항목 | 내용 |
|---|---|
| 칩 이름 | Jalapeño (OpenAI 'Intelligence Processor') |
| 공개일 | 2026년 6월 24일 |
| 파트너 | Broadcom (공동 설계·양산) |
| 용도 | LLM 추론 전용 (학습용 아님) |
| 설계 방식 | 백지에서 새로 그린 blank-slate 설계 |
| 개발 기간 | 설계 착수 → 테이프아웃 단 9개월 |
| 성능 | 전력 대비 성능(perf/watt) "현 최첨단 대비 실질적으로 향상" |
| 검증 상태 | 엔지니어링 샘플이 랩에서 목표 주파수·전력으로 동작, GPT-5.3-Codex-Spark 워크로드 구동 |
| 배포 시점 | 2026년 말 초기 배포 시작 → 이후 확대 |
| 규모 | Microsoft 등 파트너와 기가와트급 데이터센터 |
표를 한 줄씩 보자. 우선 '추론 전용'이라는 못 박기가 핵심이야. AI 칩은 크게 모델을 가르치는 학습용과, 다 만든 모델을 굴리는 추론용으로 나뉘는데, 실제로 매일매일 돈이 새는 곳은 추론이야. 수억 명이 ChatGPT에 질문을 던질 때마다 추론이 돌거든. Jalapeño는 바로 그 비용이 가장 큰 자리를 정조준했어. '제일 비싼 곳부터 내 칩으로 갈아끼우겠다'는 전략이지.
두 번째로 '백지 설계'와 'OpenAI 모델로 설계를 가속했다'는 대목이 의미심장해. OpenAI는 ChatGPT·Codex·API·에이전트를 실제로 운영하며 쌓은 데이터로 '우리 워크로드엔 뭐가 필요한가'를 정의했고, 심지어 GPT 모델 자체를 칩 설계 최적화에 동원했어. AI가 자기를 더 잘 굴릴 칩을 설계하는 데 쓰인 셈이야. 9개월이라는 미친 속도의 비밀 한 조각이 여기 있어.
세 번째로 성능 수치가 아직 '정성적'이라는 점도 솔직히 짚자. OpenAI는 "전력 대비 성능이 현 최첨단 대비 실질적으로 좋다"고만 했지, 구체적 벤치마크 숫자는 공개하지 않았어. 다만 엔지니어링 샘플이 랩에서 GPT-5.3-Codex-Spark 추론을 목표 사양대로 돌리고 있다는 건, 페이퍼 칩이 아니라 실리콘이 실제로 동작한다는 뜻이야. 마케팅이 아니라 물건이 있다는 거지.
각자의 이득 — 누가 뭘 얻나
OpenAI의 이득부터 보자. 첫째, 비용 통제권이야. 추론을 자기 칩으로 돌리면 GPU를 비싸게 빌리는 구조에서 벗어나 단위 추론당 비용을 직접 깎을 수 있어. 둘째, 공급 안정성. 엔비디아 GPU 물량은 늘 모자라고 줄을 서야 하는데, 자체 칩 라인을 확보하면 '컴퓨트가 없어서 못 키우는' 병목을 스스로 풀 수 있어. 셋째, 설계 주권. 모델과 칩을 같이 설계하면 둘을 한 몸처럼 최적화할 수 있어. 애플이 칩과 OS를 같이 만들어 누리는 그 이점을, OpenAI가 AI에서 노리는 거야.
Broadcom의 이득도 분명해. OpenAI라는 초대형 앵커 고객을 정식으로 확보했고, 이게 '멀티 세대 컴퓨트 플랫폼'의 1세대라는 점이 중요해. 한 번 칩을 같이 만들기 시작하면 2세대, 3세대로 관계가 길게 묶이거든. Broadcom 입장에선 구글 TPU에 이어 OpenAI 칩까지, 'AI 시대의 커스텀 실리콘은 우리가 짓는다'는 포지션을 굳히는 거야. 발표 당일 시장이 Broadcom을 'AI 칩 전쟁의 숨은 승자'로 본 이유가 이거고.
그리고 의외의 수혜자이자 긴장 포인트는 Microsoft와 파트너들이야. Broadcom이 Microsoft 등과 기가와트급 데이터센터 배포를 2026년부터 시작한다고 했는데, 이건 Jalapeño가 단순 실험이 아니라 실제 대규모 인프라에 들어간다는 뜻이야. OpenAI의 칩이 Microsoft 클라우드 위에서 돌면, 양쪽 모두 엔비디아 청구서를 동시에 줄일 수 있어. 다만 그만큼 두 회사의 인프라가 더 깊게 얽힌다는 양날의 검이기도 하지.
과거 유사 사례 — 성공과 실패
자체 칩 도전은 OpenAI가 처음이 아니야. 가장 빛나는 성공은 구글의 TPU야. 구글은 2015년경부터 자체 텐서 처리기를 만들어 검색·번역·Gemini까지 자기 칩 위에서 돌렸고, 엔비디아 의존을 크게 줄이며 추론 비용을 통제했어. '모델 회사가 칩까지 직접 만들면 이렇게 강해진다'를 증명한 대표 사례지. OpenAI의 Jalapeño는 명백히 이 길을 따라가고 있어.
또 하나는 아마존의 Trainium·Inferentia야. AWS는 자체 학습·추론 칩으로 클라우드 고객에게 '엔비디아보다 싼 선택지'를 제시했어. 완벽히 엔비디아를 대체하진 못했지만, '비용에 민감한 워크로드를 자체 칩으로 빨아들이는' 전략으로 의미 있는 점유율을 만들었어. Jalapeño도 비슷하게 'OpenAI 내부 워크로드부터 갈아끼우는' 방식으로 갈 가능성이 높아.
반대로 실패의 그림자도 있어. 자체 칩은 설계만 한다고 끝이 아니야. 소프트웨어 생태계가 받쳐줘야 하는데, 엔비디아의 CUDA가 십수 년간 쌓아온 그 두꺼운 생태계를 따라잡는 게 진짜 난관이야. 수많은 스타트업이 'AI 칩 하드웨어'는 만들었지만 소프트웨어 스택에서 무너졌어. 다만 OpenAI는 칩을 외부에 파는 게 아니라 '자기 모델 한 종류만 잘 돌리면 되는' 폐쇄 환경이라, 이 함정을 상당 부분 피해 갈 수 있다는 게 강점이야.
경쟁자 카운터 플레이
가장 직접 타격을 받는 건 당연히 엔비디아야. OpenAI는 엔비디아 GPU의 최대 큰손 중 하나였거든. 그 큰손이 추론 물량 일부를 자체 칩으로 돌리기 시작하면, 엔비디아의 'AI = 엔비디아' 등식에 금이 가. 다만 단기적으로 엔비디아가 흔들릴 일은 없어. 학습용 초고성능 GPU 수요는 여전히 폭발적이고, Jalapeño는 추론에만 한정돼 있으니까. 엔비디아의 카운터는 '추론까지 잘하는 통합 플랫폼'과 CUDA 생태계 잠금으로 갈 거야.
구글은 묘한 위치야. 한편으론 TPU로 이미 같은 길을 먼저 갔으니 '거봐, 자체 칩이 답이야'를 입증한 셈이고, 다른 한편으론 OpenAI가 따라붙으면서 '자체 칩'이라는 차별점이 희석돼. 구글의 카운터는 TPU의 세대 우위(이미 수년 앞선 양산 경험)와, Gemini와의 수직 통합 완성도로 갈 가능성이 커.
아마존·메타·마이크로소프트 같은 빅테크도 다 자체 칩을 굴리거나 준비 중이야. 결국 'AI 추론은 각자 자기 칩으로'라는 흐름이 굳어지는 거고, 그 칩을 누가 대신 찍어주느냐의 싸움에서 Broadcom·TSMC가 조용히 최대 수혜를 보는 구도야. 칩 전쟁의 진짜 승자는 무기를 파는 쪽일 수 있다는 거지.
그래서 뭐가 달라지는데
일반 ChatGPT 사용자라면 당장 체감할 변화는 거의 없어. 다만 중장기적으론 좋은 신호야. 추론 비용이 내려가면 OpenAI가 무료·저가 티어를 더 후하게 풀거나, 더 무거운 모델을 더 싸게 제공할 여지가 생기거든. '내 칩으로 싸게 돌린다'는 결국 '사용자에게 더 줄 여력'으로 돌아올 수 있어.
AI 스타트업·개발자라면 주목할 건 'API 가격의 미래'야. OpenAI가 인프라 비용을 자체 칩으로 깎으면, 그게 API 단가 인하 경쟁의 탄약이 돼. 다만 반대로 OpenAI가 자체 칩에 최적화된 모델을 밀면, 특정 모델·기능이 OpenAI 인프라에 더 묶일 수도 있어. 종속성과 가격, 두 가지를 같이 봐야 해.
반도체·인프라 투자에 관심 있다면 이건 'AI 칩 다변화'라는 큰 테마의 또 한 번의 확인 사살이야. 엔비디아 단독 시대에서, 빅테크가 저마다 자체 칩을 찍고 그걸 Broadcom·TSMC가 받아내는 생태계로 무게중심이 옮겨가고 있어. 단, 성능 벤치마크 수치가 아직 안 나왔으니 'OpenAI가 엔비디아를 대체했다'는 식의 결론은 한참 이르다는 것도 같이 기억해.
한 걸음 더 — '9개월'의 진짜 의미와 남은 변수
이 사건을 제대로 읽으려면, '9개월'이라는 숫자를 단순한 속도 자랑으로만 보면 안 돼. 반도체 개발에서 시간이 곧 돈이고 리스크거든. 보통 2~3년이 걸리는 이유는, 설계를 바꿀 때마다 검증을 다시 하고, 실패하면 수백억이 날아가기 때문이야. OpenAI가 이걸 9개월로 압축했다는 건, 단지 빨랐다는 게 아니라 '설계-검증 루프를 AI로 가속하는 새로운 칩 개발 방법론'이 실제로 작동했다는 증거야. 자기 모델로 자기 칩을 설계하는 이 자기참조 구조가, 앞으로 AI 회사들이 칩을 만드는 표준 공정이 될 수 있어.
또 하나 놓치기 쉬운 맥락은 '추론 전용'이라는 선택의 전략적 무게야. OpenAI는 학습용 칩을 만들지 않았어. 학습은 여전히 엔비디아 최상위 GPU가 필요하고, 거기서 정면 승부를 보는 건 무모하거든. 대신 매일 비용이 새는 추론을 먼저 장악해, 가장 확실한 곳에서 비용을 깎고 그 절감분을 다시 학습·연구에 투입하는 선순환을 노린 거야. '이길 수 있는 싸움부터 이긴다'는 전형적인 자원 배분 전략이지.
다만 냉정하게 봐야 할 변수도 분명해. 첫째, 수율(yield)이야. 랩에서 엔지니어링 샘플이 도는 것과, 기가와트급 데이터센터를 채울 만큼 안정적으로 대량 생산하는 건 전혀 다른 난이도야. 둘째, 소프트웨어야. 칩이 아무리 좋아도 그 위에서 모델을 효율적으로 돌리는 컴파일러·런타임이 받쳐주지 않으면 성능이 안 나와. OpenAI는 모델과 칩을 같이 설계해 이 부분을 유리하게 가져갔지만, 실제 운영 규모에서 검증되기 전까진 미지수야.
셋째이자 가장 큰 그림은 '협상력'이야. 자체 칩이 실제로 양산되든 안 되든, OpenAI가 '우리는 대안이 있다'는 카드를 손에 쥔 것만으로도 엔비디아와의 가격·물량 협상에서 지렛대가 생겨. 칩 하나의 성능보다, 이 협상 구도의 변화가 장기적으로 더 큰 돈을 움직일 수 있어. Jalapeño는 칩이자, 동시에 협상 테이블 위의 가장 강력한 메시지인 셈이야.
🥄 남은 궁금증 세 가지
— 그래서 엔비디아 끝난 거야? 전혀 아니야. Jalapeño는 추론 전용이고, 모델을 가르치는 학습 영역은 여전히 엔비디아 천하야. 게다가 성능 숫자도 아직 공개 안 됐어. '의존을 줄이는 첫걸음'이지 '대체'라고 보긴 일러.
— 9개월이면 너무 빠른 거 아냐? 진짜 작동해? 랩에서 엔지니어링 샘플이 목표 사양대로 GPT-5.3-Codex-Spark를 돌리고 있다니, 페이퍼 칩은 아니야. 다만 '랩에서 동작'과 '기가와트 데이터센터에서 안정 양산'은 다른 난이도라, 연말 실제 배포가 진짜 시험대야.
— 나도 이 칩 살 수 있어? 아니. Jalapeño는 OpenAI가 자기 인프라에서 자기 모델 돌리려고 만든 칩이지, 시장에 파는 제품이 아니야. 너랑 나는 그 위에서 돌아가는 ChatGPT를 쓰게 되는 거고, 칩 자체를 만질 일은 없어.
참고 자료
- OpenAI and Broadcom unveil LLM-optimized inference chip — OpenAI
- OpenAI unveils its first custom chip, built by Broadcom — TechCrunch
- OpenAI and Broadcom reveal Jalapeno, first AI chip in partnership — CNBC
- OpenAI unveils first custom AI inference chip, Jalapeño — VentureBeat
- Broadcom and OpenAI unveil custom-built Jalapeño inference processor — Tom's Hardware
- OpenAI, Broadcom debut custom Jalapeño chip for AI inference — SiliconANGLE
숫자와 기준은 발표 시점 기준이라 바뀔 수 있어. 투자 판단은 각자의 몫!
출처
- OpenAI and Broadcom unveil LLM-optimized inference chip — OpenAI
- OpenAI unveils its first custom chip, built by Broadcom — TechCrunch
- OpenAI and Broadcom reveal Jalapeno, first AI chip in partnership — CNBC
- OpenAI unveils first custom AI inference chip, Jalapeño — VentureBeat
- Broadcom and OpenAI unveil custom-built Jalapeño inference processor — Tom's Hardware
- OpenAI, Broadcom debut custom Jalapeño chip for AI inference — SiliconANGLE
관련 기사
AI 트렌드를 앞서가세요
매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.

