spoonai
TOPMicrosoftBuild 2026MAI

MS가 빌드 2026서 던진 한 방… 자체 AI 모델군 + Copilot 코딩모델 'Project Polaris'로 OpenAI 끈을 끊는다

마이크로소프트가 6월 2일 빌드 2026 기조연설에서 MAI-Image 2.5·MAI-Voice 2·MAI-Transcribe 1.5에 더해 GitHub Copilot용 자체 코딩 모델 'Project Polaris'를 공개했어. 8월부터 Copilot 기본 모델로 GPT-4 Turbo를 대체해. 나델라는 'Windows는 더 이상 사람만을 위한 플랫폼이 아니다'라고 했어.

·7분 소요·Notebookcheck / 멀티 매체 기조연설 보도Notebookcheck / 멀티 매체 기조연설 보도
공유
마이크로소프트 빌드 2026 — MAI 자체 AI 모델군과 Copilot 코딩모델 Project Polaris 공개
출처: Microsoft AI

"Windows는 더 이상 사람만을 위한 플랫폼이 아니다" — 나델라가 6월 2일 던진 선언

6월 2일 아침, 샌프란시스코 포트메이슨센터. 사티아 나델라가 빌드 2026 기조연설 무대에 올라 던진 첫 문장이 이거였어. "Windows는 더 이상 사람 사용자만을 위한 플랫폼이 아니다." 40년 넘게 '사람이 클릭하는 OS'였던 Windows를, 이제 'AI 에이전트가 직접 실행하는 플랫폼'으로 다시 정의하겠다는 거지.

그런데 진짜 뉴스는 그 선언 뒤에 줄줄이 나온 모델들이었어. 마이크로소프트가 그동안 'OpenAI에 수백억 달러를 꽂은 회사'였다면, 이번 빌드에서는 'OpenAI 없이도 돌아가는 자체 모델 스택'을 처음으로 한 무대에 다 깔았거든. 텍스트-이미지 모델, 다국어 음성합성, 음성인식, 그리고 가장 충격적인 건 GitHub Copilot에 들어갈 자체 코딩 모델 'Project Polaris'야. 이건 그냥 신제품 발표가 아니라, MS가 AI 공급망에서 OpenAI 의존도를 줄이려고 본격적으로 칼을 빼든 사건이야.

며칠 전 'MS가 사내 AI 코딩 비용 폭증으로 Claude Code를 접었다'는 뉴스 기억나? 그 비용 위기를 외부 모델에 계속 의존하면서 풀 수는 없잖아. 답은 결국 '내 모델을 내가 만든다'였고, 빌드 2026이 그 답을 공개하는 자리였어.

주인공 소개 — MAI, 무스타파 술레이만, 그리고 빌드라는 무대

**MAI(Microsoft AI)**는 이번 이야기의 핵심 조직이야. 마이크로소프트가 자체 파운데이션 모델을 만들기 위해 꾸린 팀인데, 이걸 이끄는 사람이 **무스타파 술레이만(Mustafa Suleyman)**이야. 딥마인드 공동창업자였고, Inflection AI를 거쳐 2024년 마이크로소프트에 합류해 소비자 AI 전체(Copilot 포함)를 총괄하게 된 인물이지. MS가 그를 데려온 이유가 바로 이거였어 — 'OpenAI가 만들어준 모델을 파는 회사'가 아니라 '우리 모델을 가진 회사'가 되기 위해서.

사티아 나델라는 그 큰 그림을 그리는 사람이야. 클라우드(Azure)로 MS를 부활시킨 그가 이번엔 'Windows를 에이전트 플랫폼으로' 라는 명제를 들고 나왔어. PC 운영체제, 클라우드, 오피스, 개발도구(GitHub)를 다 가진 회사가 'AI 에이전트가 이 모든 걸 직접 조작한다'고 선언하면, 그건 단순한 기능 추가가 아니라 컴퓨팅 패러다임을 바꾸겠다는 야심이야.

**빌드(Build)**는 마이크로소프트의 연례 개발자 컨퍼런스야. 일반 소비자용 발표가 아니라, MS 플랫폼 위에서 뭔가를 만드는 전 세계 개발자들에게 '앞으로 1년 동안 우리가 뭘 줄지'를 못 박는 자리지. 그래서 빌드에서 공개되는 건 대부분 '개발자가 당장 쓸 수 있는 도구'야. 올해 약 2,500명의 개발자가 포트메이슨에 모였고, 그 앞에서 MS는 자체 모델 카드를 한꺼번에 꺼냈어.

핵심 내용 — 모델 네 장, 그리고 'Polaris'라는 진짜 폭탄

이번에 공개된 모델을 표로 정리하면 이래.

모델 종류 핵심 포인트
MAI-Image 2.5 텍스트→이미지 고품질판 + 빠른 2.5e 변형, 이미지 업로드 받아 편집까지
MAI-Voice 2 다국어 TTS 한국어 포함 ~15개 언어 추가, 분노·혼란·당황 등 감정 표현
MAI-Transcribe 1.5 음성→텍스트 25개 언어 최저 단어오류율 주장했던 전작의 점진 개선
Project Polaris 코딩 모델 MoE 구조, 8월부터 GitHub Copilot 기본 모델로 GPT-4 Turbo 대체

MAI-Image 2.5는 텍스트로 이미지를 만드는 모델인데, 고품질 버전과 더 빠른 'MAI-Image-2.5e' 두 갈래로 나왔어. 핵심은 이미지를 '업로드'받을 수 있다는 거야. 생성만 하는 게 아니라, 사용자가 올린 이미지를 편집하는 것까지 한다는 거지. Copilot, Microsoft Foundry, MAI 플레이그라운드에 들어가.

MAI-Voice 2는 다국어 음성합성(TTS) 모델이야. 독일어, 호주/미국 영어, 스페인어, 프랑스어, 힌디어, 인도네시아어, 이탈리아어, 일본어, 한국어, 네덜란드어, 포르투갈어, 터키어, 베트남어, 중국어까지 약 15개 언어를 새로 얹었고, 무엇보다 분노·혼란·당황 같은 더 넓은 감정 톤을 표현해. 음성 비서가 '사람처럼' 들리게 만드는 핵심 조각이지.

MAI-Transcribe 1.5는 4월에 나온 음성인식 모델의 개선판이야. 전작이 25개 언어에서 최저 단어오류율(WER)을 주장했는데, 그 위에 점진적 성능을 얹은 버전이야.

그런데 이 세 개는 사실 '에피타이저'야. 진짜 메인은 Project Polaris거든. GitHub Copilot에 들어갈 MS 자체 코딩 모델인데, MoE(Mixture-of-Experts) 구조로 언어·프레임워크별 전문 서브모듈을 두고, 복잡한 멀티파일 리팩터링에는 chain-of-thought·tree-of-thought 추론을 쓴대. 그리고 2026년 8월부터 Copilot의 기본 모델로 GPT-4 Turbo를 대체해. 자동 마이그레이션과 폴백 기간이 제공되고. 다시 말해, 수백만 Copilot 사용자가 8월부터는 OpenAI 모델이 아니라 MS 자체 모델로 코딩하게 된다는 거야.

각자의 이득 — MS에게, 개발자에게, OpenAI에게

마이크로소프트에게 이번 발표의 핵심은 '비용 통제권'과 '독립성'이야. 그동안 Copilot이 잘 팔릴수록 OpenAI에 내는 추론 비용도 같이 불어났어. 남의 모델을 쓰면 가격·정책·로드맵을 남이 정하니까. 자체 모델 Polaris로 갈아타면 MS는 추론 원가를 직접 통제하고, 마진을 자기 주머니에 넣고, 기능 우선순위도 스스로 정해. 이건 '돈을 아끼는' 문제를 넘어 'AI 사업의 운전대를 누가 쥐느냐'의 문제야.

개발자에게는 일단 선택지가 늘어. 무료/저가 티어에서 더 빠르고 싼 모델을 쓸 수 있게 되고, 이미지·음성·전사 모델이 Azure와 Foundry에 통합되면 앱에 AI를 붙이는 비용도 내려가. 다만 8월에 Copilot 기본 모델이 강제로 Polaris로 바뀌는 건 양날의 검이야. 자동 마이그레이션은 편하지만, 'GPT-4 Turbo의 그 느낌'에 맞춰 프롬프트와 워크플로우를 짜놨던 팀은 결과물 품질이 미묘하게 달라질 수 있거든. 그래서 MS가 3개월 폴백 기간을 둔 거고.

OpenAI에게는 복잡한 신호야. MS는 여전히 OpenAI의 최대 투자자이자 클라우드 공급자지만, 동시에 '우리는 너 없이도 된다'는 걸 빌드 무대에서 공개적으로 증명한 셈이거든. 앤트로픽·OpenAI가 IPO를 향해 달려가는 이 시점에, 가장 큰 우군이 자체 모델로 갈아타는 그림은 OpenAI의 장기 매출 전망에 그림자를 드리워. 물론 ChatGPT·API 시장은 여전히 거대하지만, 'Copilot이라는 초대형 분배 채널'을 일부 잃는 건 작은 일이 아니야.

과거 유사 사례 — '자체 모델로 갈아타기'는 늘 통했나

플랫폼 회사가 '남의 핵심 부품을 자체 개발로 대체하는' 전략은 테크 역사에서 반복돼 왔어. 성공도 있고 실패도 있어.

성공 사례 — 애플의 실리콘 독립. 애플은 오랫동안 인텔 CPU를 썼지만, 결국 자체 설계 M 시리즈 칩으로 맥을 통째로 갈아탔어. 초기엔 '호환성 괜찮겠어?'라는 의심이 컸지만, 성능·전력효율·원가에서 압도하면서 완벽히 자리잡았지. 교훈: 핵심 부품을 내재화하면 단기 진통은 있어도 장기적으로 마진과 통제권을 다 가져온다는 거야. Polaris도 정확히 이 길을 노려.

경계 사례 — 구글의 자체 모델 전환 진통. 구글은 검색·클라우드에 자체 LLM(제미나이 계열)을 밀어넣으면서 여러 번 품질 논란과 출시 지연을 겪었어. '우리 모델이 최고'라고 발표했다가 실사용에서 기대에 못 미쳐 욕을 먹은 사례도 있었고. 교훈: 자체 모델은 '발표 스펙'과 '실사용 품질' 사이 간극이 늘 변수야. Polaris가 8월에 Copilot 기본값이 됐을 때, HumanEval 점수가 아니라 실제 개발자 경험에서 GPT-4 Turbo를 능가하느냐가 진짜 시험대야.

실패 위험 사례 — 강제 전환의 역풍. 과거 여러 SaaS가 기존 엔진을 자체 기술로 강제 교체했다가, 사용자들이 '예전이 더 좋았다'며 이탈한 경우가 있었어. 특히 개발도구는 사용자가 도구의 '버릇'에 깊이 적응해 있어서, 기본 모델이 바뀌면 미묘한 거부감이 생겨. 교훈: MS가 자동 마이그레이션·폴백을 강조한 건 바로 이 역풍을 알기 때문이야. 전환의 성패는 모델 성능만큼이나 '얼마나 매끄럽게 갈아타게 하느냐'에 달려 있어.

경쟁자 카운터 플레이

OpenAI는 'Copilot이 떠나도 우리는 ChatGPT·API·기업 시장이 있다'는 카드로 맞서. 동시에 자체 코딩 에이전트와 모델 고도화로 'MS 자체 모델보다 우리가 여전히 낫다'는 걸 증명하려 할 거야. IPO를 준비하는 입장에서 'MS 의존 매출이 줄어도 직접 매출이 커진다'는 스토리를 시장에 보여줘야 하고.

앤트로픽은 묘한 위치야. MS가 사내에서 Claude Code를 접고 자체 모델로 가는 흐름은 앤트로픽에 직접 타격이지만, 반대로 'MS 생태계에 묶이기 싫은 개발자'를 Claude로 끌어올 기회이기도 해. 앤트로픽은 코딩 성능(Claude의 강점)과 '특정 빅테크에 종속되지 않는 중립 모델'이라는 포지셔닝으로 Polaris의 빈틈을 노릴 거야.

구글은 제미나이 + 자체 코딩 도구(예: 안드로이드 스튜디오·Gemini Code Assist)로 자체 스택을 밀어. MS가 'Windows+Copilot+자체 모델'로 수직 통합을 강화하니, 구글도 '구글 클라우드+제미나이+개발도구'로 똑같이 묶어서 대응해. 결국 빅테크들이 각자 'OS-클라우드-모델-개발도구'를 한 줄로 꿰는 수직 통합 경쟁으로 가는 거야.

그래서 뭐가 달라지는데

Copilot을 쓰는 개발자에게는 8월이 분기점이야. 별다른 설정을 안 하면 8월부터 기본 모델이 Polaris로 바뀌어. 지금 GPT-4 Turbo 기준으로 프롬프트·워크플로우를 최적화해둔 팀이라면, 7~8월에 Polaris로 같은 작업을 돌려보고 품질을 비교해보는 게 좋아. 폴백 기간이 있을 때 미리 검증해두라는 거지. 반대로 비용에 민감한 개인·소규모 팀이라면 더 싸고 빠른 기본 모델은 반가운 소식이고.

AI 앱을 만드는 사람에게는 'MS 스택만으로 멀티모달을 다 붙일 수 있게 됐다'는 점이 중요해. 이미지 생성·편집(MAI-Image), 음성합성(MAI-Voice, 한국어 포함), 전사(MAI-Transcribe)가 Azure·Foundry에 통합되면, 굳이 여러 외부 API를 조합하지 않고 한 곳에서 멀티모달 앱을 만들 수 있어. 단가와 통합 난이도가 내려가는 거지.

업계를 지켜보는 투자자·독자에게는 'AI 인프라 전쟁의 축이 모델 자체 개발로 옮겨갔다'는 큰 그림이 보여. 한때 '빅테크는 OpenAI/앤트로픽에서 모델을 사다 쓴다'가 공식이었다면, 이제 MS·구글·아마존이 다 자체 모델로 핵심 워크로드를 갈아타고 있어. 모델을 '사는' 시대에서 '만드는' 시대로. 다만 발표 스펙과 실사용 품질 사이의 간극은 늘 있으니, Polaris의 진짜 평가는 8월 이후 개발자들의 실사용 후기가 나올 때까지 한 박자 식혀서 보는 게 맞아.

참고 자료

관련 기사

무료 뉴스레터

AI 트렌드를 앞서가세요

매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.

매일 30개+ 소스 분석 · 한국어/영어 이중 언어광고 없음 · 1-클릭 해지