spoonai
TOPDefenseMicrosoftAmazon

펜타곤이 빅테크 AI를 기밀망 안으로 들였다 — 7개사 동시 계약의 의미

미 국방부가 마이크로소프트·아마존·구글·앤트로픽 등 7개 프론티어 AI 기업과 기밀 펜타곤 컴퓨터망에 모델을 배치하는 계약을 동시에 체결했다. 행정 자동화에 머물던 군의 AI가 정보·작전·지휘 영역으로 본격 진입했음을 보여주는 신호다.

·10분 소요·Washington PostWashington Post
공유
펜타곤 본부 — 7개 AI 기업과 기밀 군사망 배치 계약 체결
출처: Wikimedia Commons (CC BY-SA)

7개사

2년 전, 펜타곤이 LLM을 어디까지 쓸지 두고 워싱턴 안에서도 의견이 갈렸어. 한쪽에서는 "비기밀 행정 잡무까지만"이라고 그었고, 다른 쪽에서는 "정보 분석에서 인간 분석관 역할을 줄이려면 결국 기밀망 안으로 들여야 한다"고 맞섰지. 5월 1일, 워싱턴포스트가 단독으로 보도한 한 줄이 그 토론을 끝냈어. 7개의 프론티어 AI 기업이 미 국방부 기밀 컴퓨터망에 자사 모델을 배치하는 계약을 체결했다.

명단을 봐. Microsoft, Amazon Web Services, Google, Anthropic이 핵심에 있어. Palantir와 Scale AI가 데이터 파이프라인 역할로 들어가고, OpenAI는 별도 채널로 합류한 것으로 알려졌어. 7개사가 한 번에 들어간 건 클라우드 사업자 4사가 동시 진입했던 2022년 JWCC(Joint Warfighting Cloud Capability) 이후 처음이야. JWCC가 "데이터를 어디에 둘 것인가"를 정한 계약이었다면, 이번 7개사 계약은 "그 데이터 위에서 무엇을 추론할 것인가"를 정한 계약이야. 무게가 다르지.

문장 한 줄 차이라고 생각하지 마. 비기밀 환경에서 GPT를 쓰는 거랑 SIPRNet/JWICS 같은 기밀망에서 쓰는 건 완전히 다른 게임이야. 모델 가중치를 air-gapped 환경에 그대로 가져오거나, 키 관리·로그·감사 추적까지 한 단계 위 기준을 맞춰야 해. 그 컴플라이언스 비용을 7개 회사가 동시에 지불하기로 했다는 뜻이고, 펜타곤은 그걸 받아들일 만큼 프론티어 모델의 성숙도를 인정했다는 뜻이야.

각 주체 — 펜타곤은 왜 지금이고, 빅테크는 왜 같이 들어갔나

펜타곤 쪽 동기는 명확해. 우크라이나 전쟁과 인도-태평양 긴장이 동시에 길어지면서, 분석관 1명당 처리해야 하는 신호 정보(SIGINT)와 위성 영상(GEOINT)이 폭발적으로 늘었어. 미 정보당국이 공개적으로 인정하는 숫자만 봐도 위성 자산이 5년 전 대비 4배가 됐고, 드론이 뽑아내는 비디오 피드는 두 자리 배수로 증가했어. 사람을 뽑는 속도는 이걸 따라잡을 수 없어. CDAO(Chief Digital and AI Officer) Radha Plumb은 작년 의회 청문회에서 "분석 백로그를 줄이지 않으면 우리는 결정 사이클에서 진다"고 말했어. 이번 계약은 그 발언의 실행이야.

빅테크 쪽 동기도 분명해. 그동안 군 매출은 클라우드 인프라 회선료 정도였어. JEDI(2018, 폐기), JWCC(2022)로 흐름이 잡혔지만 마진은 일반 클라우드보다 낮았지. AI 모델 라이선스가 들어가면 이야기가 달라져. 토큰 단위 과금 + 전용 파인튜닝 + 보안 인증 프리미엄이 붙어. Microsoft는 이미 Azure Government Top Secret 리전을 가동 중이고, AWS는 Top Secret-East/West 리전을 운영해. 두 회사는 "모델만 들이면 인프라는 이미 깔려 있다"는 포지션이야.

흥미로운 건 Anthropic의 합류야. Anthropic은 안전성을 전면에 내세우며 "위험한 사용처는 거른다"는 정책을 표방해 왔어. 군 활용은 그 노선과 충돌한다는 비판이 외부에서 나왔지. CEO Dario Amodei는 작년 The Verge 인터뷰에서 "방어 목적의 정보 분석은 우리 정책에 부합한다"고 선을 그었어. 이번 계약에 들어가면서 그 선을 운영 단계에서 시험받게 됐지. 들어간 이상 다음 질문은 "어디까지가 분석이고 어디부터가 작전이냐"가 될 거야.

Google은 2018년 Project Maven 사내 반발로 한 번 물러섰던 회사야. 8년 만에 같은 영역으로 돌아온 셈이지. 사내 분위기는 그때와 달라. AI 군 활용을 둘러싼 사회적 합의가 그동안 한 단계 이동했고, Sundar Pichai는 작년 사내 타운홀에서 "방위 협력은 우리 책임 영역에 속한다"고 정리했어. Project Maven 시절 직원 4,000명이 서명했던 항의서한 같은 대규모 이탈은 이번엔 보고되지 않았어.

Palantir는 이미 펜타곤 안에서 가장 깊숙이 들어간 데이터 회사야. 이번 계약에서 그 위치는 더 강해졌어. 모델 7개를 동시에 운용하려면 데이터를 정리해 주는 미들웨어가 필요한데, 그 자리를 Palantir가 잡았어. 시장이 이 사실을 알아챈 건 이미 가격에 반영돼 있어 — Palantir 주가는 2024년 이후 5배 가까이 올랐고, 그 상승의 핵심 내러티브가 군 AI 통합이야.

핵심 내용 — 계약 구조와 숫자

워싱턴포스트가 보도한 계약 구조를 정리하면 이래.

회사 역할 기밀 등급 추정 계약 가치
Microsoft Azure GPT/Copilot 군 버전 Top Secret 수십억 달러대
AWS Bedrock + Anthropic 모델 호스팅 Top Secret 수십억 달러대
Google Gemini 군 버전 + Vertex AI Secret-Top Secret 비공개
Anthropic Claude 군 라이선스 (AWS 통해) Top Secret 비공개
OpenAI GPT 군 버전 (Microsoft 채널) Secret-Top Secret 비공개
Palantir 데이터 통합·미들웨어 Top Secret 수십억 달러대
Scale AI 데이터 라벨링·평가 Top Secret 수억 달러대

각 계약의 정확한 금액은 비공개야. 워싱턴포스트는 7개사 합산이 5년 누적 100억 달러대로 추정된다고 썼어. 펜타곤 연간 IT 예산 약 600억 달러 중 AI 관련 항목으로 추적 가능한 금액이 작년 약 18억 달러였던 걸 감안하면 단계가 한 칸 올라간 거야. 이전 골든 비교로는 JWCC(클라우드 4사 90억 달러 5년)가 있어. JWCC가 그릇이라면 이번 계약은 그 위에 올리는 음식이지.

기밀 등급이 중요해. Top Secret 환경 (TS/SCI)에서 LLM이 운용된다는 게 가장 큰 뉴스야. 일부는 air-gap된 단독 클러스터에서 모델 가중치 자체를 펜타곤 인프라에 가져와 돌리고, 일부는 클라우드 사업자의 격리 리전에서 돌려. 어느 쪽이든 일반 사용자가 접하는 GPT/Claude/Gemini와는 별개의 운영 분리(operational segregation)가 적용돼. 모델 출력이 토큰 단위로 감사 로그에 남고, 사용자별 권한 체계(NEED-TO-KNOW)가 모델 호출 단계에서부터 강제돼.

각자의 이득

펜타곤에게 — 분석 백로그가 줄어. SIGINT 분석관 1명이 처리하던 음성 도청 데이터를 LLM이 1차 트리아지(triage)해서 우선순위가 높은 것만 사람에게 올려. 미 공군은 작년 비기밀 환경에서 시범 운용한 결과 "트리아지 시간 60% 단축"을 내부 보고했어. 이걸 기밀망 데이터에 적용하면 지표는 더 클 가능성이 높아. 작전 측면에서는 Joint Operations Center에서 실시간 상황 요약(Situational Briefing)을 LLM이 자동 생성하는 시나리오가 첫 단계로 검토되고 있어. 사람이 5분간 정리하던 브리프를 30초 안에 초안으로 받는 거지.

Microsoft에게 — Azure Government TS 리전의 활용도가 폭발적으로 올라가. 그동안 이 리전은 인프라 임대 수익이 주였는데, GPT/Copilot이 토큰 단위 매출로 합류해. CFO Amy Hood는 작년 분기 실적 콜에서 "정부 클라우드 매출 성장률이 일반 클라우드를 앞선다"고 언급했어. 이번 계약은 그 추세를 5년간 보장하는 셈이야.

Amazon에게 — AWS Bedrock이 펜타곤 기본 모델 게이트웨이가 되면, 그 위에서 돌아가는 Anthropic Claude뿐만 아니라 다른 외부 모델까지 모두 AWS 매출로 잡혀. Andy Jassy 입장에서 이번 계약은 OpenAI에 빼앗겼던 LLM 시장 선두 자리를 정부 채널에서 우회 회복하는 의미야.

Anthropic에게 — 안전성 노선을 시험받지만, 매출 다변화에는 유리해. 일반 시장에서 Claude는 OpenAI/Google 대비 가격 경쟁이 빡빡해. 군 라이선스는 단가가 높고 1년 단위 락인이 강해. Dario Amodei가 작년 인터뷰에서 "수익 모델은 다양한 채널로 분산해야 한다"고 말한 건 이런 그림이었어.

Google에게 — Project Maven의 그늘을 벗어나는 정치적 의미가 커. 동시에 Gemini가 GPT/Claude와 같은 무대에서 평가받는 첫 대규모 실증이야. 모델 품질 비교가 펜타곤 내부 평가를 통해 이뤄질 텐데, 그 결과는 외부로 새지 않더라도 다른 정부 발주에 영향을 줘.

OpenAI에게 — Microsoft 채널을 통한 진입은 직접 진입보다 정치적 부담이 적어. OpenAI는 사용 정책 문서에서 작년 "특정 군사 활용은 별도 검토" 조항을 명문화했어. 이번 계약은 그 별도 검토를 통과한 첫 케이스로 봐도 돼.

과거 유사 사례 — 성공과 실패

군과 빅테크의 통합 계약은 여러 번 시도됐고, 절반은 깨졌어.

JEDI (2018-2019, 실패). 펜타곤이 단일 클라우드 사업자 100억 달러를 Microsoft에 몰아줬는데, AWS가 소송을 걸었고 결국 2021년 폐기됐어. 단일 사업자 의존이 정치적·법적으로 유지 불가능하다는 교훈을 남겼지. JWCC가 4사 분산 구조로 다시 짜인 이유야.

Project Maven (2018, 부분 실패 → 재구성). Google이 드론 영상 객체 인식 프로젝트에 참여했다가 직원 4,000명 서명으로 철수했어. 펜타곤은 Palantir로 갈아탔고, Maven은 그 후 더 큰 데이터 통합 플랫폼으로 진화했어. 흥미롭게도 8년 뒤 Google은 다시 들어왔지.

JWCC (2022, 진행 중·성공으로 분류). AWS·Microsoft·Google·Oracle 4사에 5년 90억 달러를 분산 발주했어. 단일 사업자 리스크 제거 + 사업자 간 가격 경쟁 유도라는 두 가지 목표를 달성했어. 이번 7개사 AI 계약의 청사진이야.

Replicator (2023, 진행 중). 무인기·자율 시스템 1조 달러 프로그램. AI 모델보다 하드웨어 중심이지만, 의사결정 레이어에 LLM이 들어가는 그림이 그려져 있어. 이번 7개사 계약과 자연스럽게 연동될 가능성이 높아.

교훈은 셋. 첫째, 단일 사업자 몰아주기는 실패해. 둘째, 직원 반발은 통상 1회로 끝나지 않으니 미리 사회적 합의를 다져야 해. 셋째, 실제 운영은 데이터 통합 미들웨어(Palantir 역할)가 결정해. 모델 자체보다 데이터 파이프라인이 록인을 만들어.

경쟁자 카운터 플레이

중국 인민해방군(PLA). 미국이 7개사를 한 번에 묶었으니, 중국은 자국 LLM 사업자(Baidu/Alibaba/DeepSeek 등)를 군사 통합으로 묶을 거야. 이미 작년 베이징 발표로 "군민 융합" 라운드가 활발해. 직접 비교 가능한 발표는 아직 없지만, 6-12개월 안에 미러링 발표가 나올 가능성이 높아.

EU. 프랑스 Mistral, 독일 Aleph Alpha 같은 유럽 자국 모델 회사가 있는데, EU는 단일 발주 체계가 약해. 개별 회원국 군이 각자 발주하는 구조는 미국식 통합 계약을 따라가기 어려워. EU 차원에서 European Defence Fund가 AI에 더 큰 비중을 둘 거란 신호는 작년부터 있었어.

Oracle/IBM. 7개사 명단에서 빠졌어. 둘 다 펜타곤 관계는 깊지만 자체 프론티어 모델이 없어. 이번 계약 이후 두 회사가 자사 인프라 위에 외부 모델을 얹는 구조로 끼어들 수 있어. Oracle은 작년 분기 실적 콜에서 "AI 정부 발주 입찰 수십 건"을 언급했어.

소형 AI 회사들. Cohere, Mistral, AI21 같은 회사들이 직접 정부 발주에 들어오기는 진입 장벽이 너무 높아. 대신 빅테크 마켓플레이스(AWS Bedrock, Azure AI Studio)에 모델을 올려서 간접 진입하는 경로가 표준이 될 거야.

그래서 뭐가 달라지는데

개발자. 정부 클라우드 분야의 채용 수요가 늘어. 특히 Top Secret 클리어런스를 가진 ML 엔지니어는 이미 대비 + 30~50% 프리미엄을 받고 있어. AWS GovCloud, Azure Government 운영 경험은 자격 우선이야. Microsoft·AWS의 정부 사업부가 작년부터 채용을 가속하는 이유야.

창업자. AI 모델 자체로 펜타곤에 직접 진입하는 건 5년 안엔 거의 불가능해. 대신 빅테크 마켓플레이스의 추가 도구(평가, 모니터링, 거버넌스)나 데이터 라벨링 영역에선 SAM(serviceable available market)이 빠르게 커. ATO(Authorization to Operate) 인증이 있는 회사가 우대받아.

투자자. Palantir 주가는 이미 이 시나리오를 반영했어. 다음 이동은 평가·거버넌스 툴을 가진 회사들이야. Robust Intelligence, Credo AI, Arthur AI 같은 회사들이 정부 채널에서 매출을 찍기 시작하면 시그널이야. 동시에 Anthropic의 안전성 노선이 어떻게 운영되는지를 지켜보면 이 회사의 다음 라운드 평가에 영향을 줘.

일반 사용자. 군 AI 도입 자체가 일상 사용자에게 직접 영향을 주진 않아. 하지만 우리가 쓰는 GPT/Claude/Gemini 모델이 동일 회사에서 만들어진다는 점에서, 안전성·정책 결정 방향이 군 채널 압력을 받게 될 가능성이 있어. 예를 들어 거부 응답(refusal)의 기준선이 어떻게 변하는지를 지켜보면 신호가 나와.

스테이크

  • Wins: Microsoft (Azure TS 가속, 5년 락인) — 정부 클라우드 매출 비중 급등 / Palantir (미들웨어 위치 강화) — 데이터 통합 록인 강해짐 / Anthropic (매출 다변화) — 군 채널 단가 프리미엄 확보
  • Loses: Oracle/IBM (7개사 명단에서 제외) — 자체 프론티어 모델 부재 한계 노출 / 소규모 AI 스타트업 — 직접 진입 경로 더 좁아짐
  • Watching: 의회 (감독·예산 조정 권한) — 다음 NDAA 사이클에서 군 AI 가드레일 조항 추가 여부 / EU 회원국 (자국 발주 체계 결정) — 미국식 통합 계약 모델 채택할지

반대 의견 — 회의론자의 시각

Stuart Russell (UC Berkeley AI 안전 연구자, Center for Human-Compatible AI 설립자)은 트위터에서 "프론티어 모델이 기밀망 안에서 어떤 출력을 내든, 그것을 검증할 외부 감사 체계가 없으면 위험은 그대로다"라고 지적했어. 군 AI는 그 특성상 외부 평가를 받기 어렵기 때문에, 모델이 잘못된 정보를 출력하더라도 외부에서 잡아낼 방법이 제한된다는 거야.

Toby Ord (Oxford Future of Humanity Institute) 같은 AI 안전 연구자들은 "분석 단계에 머물 거라는 말은 거의 항상 시간이 지나면 깨진다"고 봐. 한번 들어간 도구는 점진적으로 의사결정 레이어로 올라가는 게 역사적 패턴이야. 그 과정에서 "사람이 최종 결정을 한다"는 약속이 어떻게 운영되는지가 진짜 시험대야.

내부 반대도 무시할 수 없어. Google은 8년 만에 다시 군 영역으로 들어왔지만, 사내에서 Project Maven급 대규모 항의는 없었어. 다만 일부 직원 그룹이 "안전성 평가에 대한 외부 공개"를 요구하고 있어. 회사 내부 어떻게 처리할지가 관찰 포인트야.

내일 아침에 할 것

개발자: AWS GovCloud / Azure Government 둘 중 하나라도 콘솔에 들어가서 IAM 정책 차이부터 익혀. 일반 클라우드와 정책 모델이 다르고, 이게 정부 사업의 첫 진입 장벽이야. 회사가 ATO 갖고 있으면 내 이력 한 줄이 바뀌는 시기야.

PM/창업자: 우리 제품에 정부 사용 시나리오가 있나? 있다면 ATO를 가진 빅테크 마켓플레이스(AWS Marketplace for Federal, Azure Marketplace Government)에 올리는 절차를 검토해. 직접 발주는 무리지만 마켓플레이스 진입은 1년 내 가능해.

투자자: Palantir 차트는 이미 반영됐으니 그 다음 단계인 거버넌스/평가 툴(Robust Intelligence, Credo AI, Arthur AI 등) 매출 노출을 추적해. 또한 Anthropic의 다음 펀딩 라운드에서 군 채널 매출이 어떻게 다뤄지는지가 가격 결정 변수야.

일반 사용자: 우리가 쓰는 GPT/Claude/Gemini의 사용 정책 페이지를 6개월에 한 번씩 비교 저장해. 군 채널에 들어간 이후 거부 응답 기준선이 어떻게 변하는지가 신호야. 그 변화는 일반 사용자 경험에도 영향을 줄 수 있어.

참고 자료

관련 기사

무료 뉴스레터

AI 트렌드를 앞서가세요

매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.

매일 30개+ 소스 분석 · 한국어/영어 이중 언어광고 없음 · 1-클릭 해지