Nvidia GTC 2026: Vera Rubin 완전 해부 — 스펙, 가격, 로드맵 총정리

"2027년까지 최소 $1T의 주문이 보인다"
Jensen Huang이 GTC 2026 키노트에서 한 말이다. 허풍이 아니라, Blackwell과 Vera Rubin을 합친 수주 전망이다. 3월 16일 산호세에서 열린 GTC 2026은 Nvidia 역사상 가장 큰 발표였다. 7개 신규 칩을 한 번에 공개하고, 자율주행에서 Disney까지 아우르는 파트너십을 쏟아냈다.
정리가 필요하다. 하나씩 뜯어보자.
Rubin GPU (R200) — 핵심 스펙
Blackwell 대비 모든 수치가 올라갔다. 핵심만 뽑으면:
| 항목 | Rubin (R200) | Blackwell (B200) | 개선 | |------|-------------|-----------------|------| | 공정 | TSMC 3nm | TSMC 4nm | — | | 트랜지스터 | 3,360억 개 | 2,080억 개 | 1.6x | | 다이 구성 | 2 컴퓨트 + 2 I/O (CoWoS-L) | 2 컴퓨트 | — | | HBM 메모리 | 288GB HBM4 (8스택) | 192GB HBM3e | 1.5x | | 메모리 대역폭 | ~22TB/s | ~8TB/s | 2.8x | | FP4 추론 성능 | 50 PetaFLOPS | ~10 PetaFLOPS | 5x | | TDP | 2,300W (MaxP) | ~1,200W | — |
50 PetaFLOPS. GPU 한 장에서. Blackwell 대비 FP4 추론이 5배다.
Vera CPU — Nvidia 자체 설계 ARM
GPU만 바뀐 게 아니다. CPU도 새로 만들었다.
- 88코어 NVIDIA Olympus (커스텀 ARM 기반)
- Spatial Multithreading: 코어당 2개 스레드 동시 실행
- 메모리 대역폭: LPDDR5X, 최대 1.2TB/s
NVL72 랙 — 실제 배치 단위
개별 GPU보다 중요한 건 랙 단위 성능이다. 실제로 데이터센터에 들어가는 건 NVL72 랙이니까.
| 항목 | Vera Rubin NVL72 | Blackwell NVL72 | |------|------------------|-----------------| | GPU 수 | 72개 (36 슈퍼칩) | 72개 | | FP4 추론 | 3.6 ExaFLOPS | ~0.9 ExaFLOPS | | HBM 총량 | 20.7TB | 13.8TB | | NVLink 대역폭 | 260TB/s (NVLink 6) | ~100TB/s | | 랙 전력 | ~190kW (MaxQ) | ~120kW | | 냉각 | 100% 수랭 (최초) | 하이브리드 | | 조립 시간 | Blackwell 대비 18배 빠름 | — |
3.6 ExaFLOPS. 랙 하나에서 엑사급 연산. 그리고 처음으로 완전 수랭 시스템이다.
Groq 3 LPU — 가장 큰 서프라이즈
Nvidia가 2025년 12월 $20B에 인수한 Groq의 첫 제품이다. 추론 전용 칩.
- 1.2 PetaFLOPS FP8 (LPU 1개)
- 500MB 온칩 SRAM — HBM이 아니라 SRAM이다
- SRAM 대역폭: 150TB/s (Rubin GPU의 HBM4가 22TB/s인 것과 비교)
Groq 3 LPX 랙(256개 LPU)을 Vera Rubin NVL72 옆에 붙이면, 메가와트당 스루풋이 35배 올라간다. 추론에 특화된 구조라 토큰 생성 속도가 극단적으로 빠르다.
출하: 2026년 3분기.
자율주행 — "ChatGPT 모멘트가 왔다"
Huang은 자율주행을 키노트의 핵심 주제로 잡았다. 새로운 DRIVE Hyperion Level 4 파트너:
- BYD — 세계 최대 EV 제조사
- 현대·기아 — 전략적 파트너십 확대
- Geely (볼보 모회사), Nissan, Isuzu
그리고 Uber 로보택시:
- 2028년까지 4개 대륙 28개 도시에 배치
- 첫 출발: 2027년 상반기 LA, 샌프란시스코
개발자가 알아야 할 것
CUDA 20주년 + 에이전트 툴킷
- CUDA Toolkit 13.1.1 (2026년 1월 릴리스)
- cuBLAS 독립 패치: 이제 CUDA 전체 업데이트 없이 cuBLAS만 업데이트 가능
- NVIDIA Agent Toolkit (오픈소스): 기업용 자율 AI 에이전트 빌드
- NemoClaw: 로컬에서 장기 실행 에이전트 개발/배포하는 오픈소스 스택
Agent Toolkit을 쓰는 기업 목록: Adobe, Atlassian, Salesforce, SAP, Siemens, ServiceNow, Red Hat 등.
DLSS 5 — 업스케일링이 아니다
DLSS 5는 업스케일링이나 프레임 생성이 아니라 **"Real-Time Neural Rendering"**이다. AI가 조명과 재질 상호작용까지 포함해서 완전한 픽셀을 직접 생성한다. RTX 50 시리즈용, 2026년 가을 출시.
로드맵 — 2028년까지
| 세대 | 시기 | 핵심 | |------|------|------| | Rubin | 2026 H2 | 3nm, HBM4, 50 PFLOPS | | Rubin Ultra | 2027 | 컴퓨트 칩렛 4개, ~100 PFLOPS, 1TB HBM4E | | Feynman | 2028 | TSMC 1.6nm(A16), 3D 다이 스태킹, NVL1152 스케일 |
Feynman이 특히 주목할 만하다. Nvidia 최초 3D 스택 GPU, 그리고 NVL1152 — 한 클러스터에 GPU 1,152개.
핵심 인용
"Every SaaS company will become an Agent-as-a-Service company." — Jensen Huang, GTC 2026
"The ChatGPT moment for autonomous driving is here." — Jensen Huang, GTC 2026
"GeForce is Nvidia's greatest marketing campaign." — Jensen Huang, CUDA 20주년 기념
참고 자료
Stay ahead of AI
Top stories, curated daily. No spam, no noise. Unsubscribe anytime.