spoonai
TOPMoonshot AIKimiOpen Source

Moonshot가 Kimi K2.7 Code를 풀었어 — 1조 파라미터 오픈소스인데, 생각은 30% 덜 해

중국 Moonshot AI가 6월 12일 코딩 특화 오픈웨이트 모델 Kimi K2.7 Code를 공개했어. 1조 파라미터 MoE에 256K 컨텍스트, 그런데 추론 토큰은 K2.6보다 30% 적게 쓰면서 코딩 벤치마크는 더 올랐어. 입력 100만 토큰당 0.95달러라는 가격이 핵심이야.

·7분 소요
공유

오픈소스 코딩 모델이 또 한 칸 올라섰어 — 이번엔 '효율'로

2026년 6월 12일, 중국 AI 스타트업 Moonshot AI가 Hugging Face에 Kimi K2.7 Code를 올렸어. K2 시리즈로만 따지면 1년도 안 되는 사이 다섯 번째 메이저 릴리스야. 출시 속도가 무섭지. 그런데 이번 모델의 포인트는 '더 크다'가 아니라 '더 똑똑하게 생각한다'에 가까워.

스펙부터 보면, 1조(1T) 파라미터의 MoE(Mixture-of-Experts) 구조에 활성 파라미터는 32B, 컨텍스트 창은 256K 토큰이야. 여기까진 전작 K2.6과 비슷한 덩치야. 진짜 달라진 건 효율이야 — 추론(thinking) 토큰을 K2.6보다 약 30% 덜 쓰면서 코딩 벤치마크 점수는 오히려 올렸거든. AI가 답을 내기 위해 '속으로 생각하는 양'을 줄였는데 정답률은 더 높아졌다는 거야. 이게 왜 중요하냐면, 추론 토큰이 곧 비용이자 지연시간이거든.

그리고 가격. API 기준 입력 100만 토큰당 0.95달러, 출력은 4.00달러야. 1조 파라미터급 모델치고는 공격적인 가격인데, 게다가 오픈웨이트로 풀려서 직접 내려받아 돌릴 수도 있어. 라이선스는 대규모 배포 시 출처 표기를 요구하는 '수정 MIT(Modified MIT)' 형태로, 상업적 사용을 허용해. '성능 좋은 폐쇄 모델'과 '값싼 오픈 모델' 사이의 거리를 다시 한 번 좁힌 릴리스야.

등장인물 — Moonshot, K2 시리즈, 그리고 '에이전틱 코딩'

첫 번째 주인공은 Moonshot AI야. 중국의 대표적 AI 스타트업 중 하나로, 'Kimi'라는 브랜드로 챗봇과 모델을 동시에 운영해. 특히 K2 시리즈를 1년도 안 돼 다섯 번이나 갈아치우며, 오픈웨이트 진영에서 가장 빠른 출시 속도를 보여주고 있어. DeepSeek과 함께 '중국 오픈소스 AI'의 두 축으로 꼽히지.

두 번째 주인공은 K2.7 Code 모델 자체야. 이름에 'Code'가 붙은 데서 보이듯, 범용 챗봇이 아니라 코딩과 에이전틱 워크플로에 특화된 모델이야. 긴 호흡의 소프트웨어 엔지니어링 — 즉 코드를 계획하고, 실행하고, 디버깅하는 과정을 여러 단계에 걸쳐 수행하는 시나리오를 정조준했어. 단발성 코드 생성이 아니라 '에이전트가 프로젝트를 끝까지 끌고 가는' 그림을 위한 모델인 거지.

세 번째 주인공은 개념인 '에이전틱 코딩(agentic coding)'이야. 요즘 AI 코딩의 화두는 '자동완성'에서 '자율 에이전트'로 넘어갔어. Claude Code, Cursor, Windsurf 같은 도구가 코드를 통째로 짜고 테스트까지 돌리는 시대잖아. K2.7 Code는 이 흐름에 오픈소스로 응답한 모델이야. 폐쇄형 상용 모델에 돈을 내는 대신, 직접 내려받아 자기 인프라에서 에이전트를 돌리고 싶은 팀을 겨냥한 거지.

핵심 내용 — 숫자로 보는 K2.7 Code

항목 내용
공개일 2026년 6월 12일 (Hugging Face)
구조 1T 파라미터 MoE / 활성 32B
컨텍스트 256K 토큰
추론 토큰 K2.6 대비 약 30% 절감
Kimi Code Bench v2 +21.8%
Program Bench +11.0%
MLS Bench Lite +31.5%
API 가격 입력 $0.95 / 출력 $4.00 (100만 토큰당)
라이선스 Modified MIT (상업적 사용 허용)

벤치마크를 보면 방향이 분명해. Kimi Code Bench v2에서 21.8%, Program Bench에서 11.0%, MLS Bench Lite에서 31.5% 개선이야. 전작 대비 두 자릿수 향상을 일관되게 보여주는데, 동시에 추론 토큰은 30% 줄였어. 보통 성능을 올리려면 모델이 '더 길게 생각'하게 만들어서 토큰을 더 쓰는데, K2.7 Code는 반대로 갔어. 더 짧게 생각하면서 더 잘 맞히는 — 효율 곡선 자체를 위로 밀어올린 거야.

이 '효율'이 실전에서 가지는 의미가 커. 에이전틱 코딩은 한 작업을 끝내기까지 수십, 수백 번의 모델 호출이 이어져. 호출마다 추론 토큰을 30% 아낄 수 있다면, 전체 작업의 비용과 시간이 통째로 줄어들어. 단순히 '벤치 점수 1~2점 높다'보다 훨씬 체감되는 차이지. 게다가 오픈웨이트라 자기 서버에서 돌리면 토큰당 과금 자체가 사라지고, 효율 개선은 곧 전기료·GPU 시간 절감으로 직결돼.

다만 1조 파라미터 모델을 '직접 돌린다'는 건 아무나 할 수 있는 게 아니야. MoE라 활성 파라미터는 32B로 줄어들지만, 여전히 상당한 GPU 메모리와 인프라가 필요해. 그래서 현실적으론 '대기업·연구소는 자체 호스팅, 개인·소규모 팀은 Kimi API'라는 이원 구조가 자연스러워. 오픈웨이트의 자유와 API의 편의 사이에서 선택지가 넓어졌다는 게 핵심이야.

각자의 이득 — 오픈웨이트가 누구에게 이득인가

Moonshot 입장에선 오픈웨이트 공개가 강력한 확산 전략이야. 모델을 무료로 풀면 전 세계 개발자가 깔고, 튜닝하고, 생태계를 키워줘. 그 과정에서 'Kimi'라는 브랜드가 글로벌 표준 후보로 자리잡지. 동시에 Kimi API와 상위 플랜으로 수익을 거두는 투-트랙 모델이야. DeepSeek이 같은 전략으로 단숨에 글로벌 인지도를 얻은 걸 Moonshot도 따라가는 거고.

개발자·스타트업은 가장 직접적인 수혜자야. 폐쇄형 상용 코딩 모델에 매달 큰돈을 쓰는 대신, 강력한 오픈웨이트 모델을 자기 인프라에서 돌릴 수 있게 됐어. 데이터를 외부에 안 보내도 되니 보안에 민감한 기업엔 특히 매력적이지. 30% 토큰 절감은 그 자체로 운영비를 깎아주고. '성능 vs 비용 vs 통제권'이라는 삼각형에서 선택의 폭이 넓어진 거야.

중국 AI 생태계 전체도 이득을 봐. Moonshot·DeepSeek 같은 회사들이 강력한 오픈웨이트를 계속 풀면, 글로벌 개발자들이 자연스럽게 중국발 모델 위에서 도구를 만들게 돼. 이건 단순 기술 경쟁을 넘어 '표준과 생태계의 영향력' 싸움이야. 미국 폐쇄형 진영이 가격과 폐쇄성으로 갈 때, 중국 오픈 진영은 개방성과 가성비로 개발자 마음을 사는 전략이지.

과거 유사 사례 — 오픈웨이트 코딩 모델의 흐름

오픈웨이트 코딩 모델의 계보를 보면 흐름이 보여. 한때는 Meta의 Code Llama가 '오픈소스 코딩'의 대명사였고, 이후 DeepSeek-Coder, Qwen-Coder 같은 중국발 모델이 빠르게 따라잡았어. 그리고 K2 시리즈처럼 1조 파라미터급 MoE가 오픈으로 풀리는 단계까지 왔지. '오픈은 성능이 떨어진다'는 통념이 해마다 깨지고 있는 거야.

성공 사례로 떠올릴 만한 건 DeepSeek의 부상이야. 강력한 오픈웨이트를 공격적 가격에 풀면서, DeepSeek은 단숨에 글로벌 개발자 커뮤니티의 주목을 받았어. '폐쇄형만큼 좋은데 열려 있고 싸다'는 조합이 얼마나 강력한지 보여준 사례지. K2.7 Code는 그 공식을 코딩·에이전틱 영역에서 한 번 더 실행한 거야.

반면 경계할 점도 있어. 오픈웨이트 모델은 '벤치마크 점수'와 '실전 신뢰성' 사이에 간극이 생기기 쉬워. 벤치에선 화려한데 실제 복잡한 코드베이스에선 헛도는 경우가 종종 있거든. 게다가 1조 파라미터를 직접 돌리는 인프라 부담, 그리고 라이선스 조항(대규모 배포 시 출처 표기 의무) 같은 현실적 제약도 따져봐야 해. 화려한 숫자에 끌리기 전에 '내 환경에서 진짜 돌릴 수 있나'를 먼저 보는 게 맞아.

경쟁자 카운터 플레이 — 폐쇄형과 다른 오픈 진영은 어떻게 받아칠까

폐쇄형 진영(Anthropic Claude, OpenAI 코딩 모델 등)은 '품질과 통합'으로 맞설 거야. 오픈웨이트가 아무리 좋아져도, 상용 에이전트는 잘 다듬어진 도구·안전장치·기업 지원을 함께 제공하거든. 직접 1조 파라미터를 운영할 여력이 없는 기업엔 '그냥 API 쓰는 게 싸고 편하다'는 논리가 여전히 유효해. 폐쇄형은 '총소유비용(TCO)'에서 우위를 강조할 거야.

같은 오픈 진영 내 경쟁도 치열해. Qwen, DeepSeek, GLM 같은 중국 오픈웨이트들이 코딩 영역에서 서로 벤치마크를 갈아치우며 달리고 있어. K2.7 Code의 '30% 토큰 절감'은 분명 차별점이지만, 다음 달에 경쟁사가 더 나은 효율 곡선을 들고 나올 수도 있어. 이 영역은 우위가 몇 주 단위로 뒤집히는 살벌한 동네야.

서구 오픈 진영(Meta 등)도 변수야. 만약 미국발 강력한 오픈웨이트 코딩 모델이 나오면, '오픈은 중국이 주도한다'는 현재 구도가 흔들릴 수 있어. 결국 개발자들은 라이선스·성능·효율·생태계를 종합해서 베이스 모델을 고르거든. K2.7 Code가 쌓은 우위가 '한 시즌짜리'에 그칠지, 지속 가능한 표준이 될지는 다음 몇 번의 릴리스 사이클에서 갈릴 거야.

그래서 뭐가 달라지는데 — 입장별로 보면

개발자라면, 당장 '내 코딩 에이전트의 백엔드 후보'가 하나 더 늘었다고 보면 돼. 폐쇄형 상용 모델에만 의존하던 워크플로에 오픈웨이트 옵션을 끼워볼 만해. 특히 토큰 비용이 부담이거나 데이터를 외부에 보내기 꺼려진다면 진지하게 평가해볼 가치가 있어. 다만 인프라 부담을 감당할 수 있는지부터 확인하고.

기업·CTO라면, 'AI 코딩 비용 구조'를 다시 들여다볼 타이밍이야. 강력한 오픈웨이트가 계속 나온다는 건, 코딩 AI의 단가가 구조적으로 내려간다는 뜻이거든. 지금 폐쇄형에 묶여 있다면, 향후 협상력이나 멀티-벤더 전략 차원에서 오픈웨이트를 벤치마크에 넣어두는 게 현명해.

일반 사용자라면, 직접 체감할 일은 적어. 다만 네가 쓰는 코딩 도구나 SaaS 뒤에서, 더 싸고 효율적인 오픈 모델이 깔리면 그 혜택이 가격이나 속도로 흘러올 수 있어. '경쟁이 치열해질수록 사용자가 이득'이라는 일반론이 코딩 AI에서도 작동하는 중이라고 보면 돼.

🥄 남은 궁금증 세 가지

— 그래서 Claude Code 대신 이걸 써야 해? 단정하긴 일러. 벤치마크 점수와 효율은 좋지만, 상용 에이전트의 통합·안정성·지원까지 합친 '실전 경험'은 또 다른 문제거든. 직접 인프라를 돌릴 여력과 보안 요구가 크다면 매력적이고, 그냥 편하게 쓰고 싶다면 폐쇄형 API가 여전히 합리적일 수 있어.

— 1조 파라미터인데 내 노트북에서 돌아가? 아니, 그건 무리야. MoE라 활성 파라미터는 32B로 줄지만, 1조 모델을 로컬에서 풀로 돌리려면 상당한 GPU 인프라가 필요해. 현실적으론 클라우드 호스팅이나 Kimi API로 접근하는 게 대부분일 거야. '오픈웨이트 = 누구나 노트북에서'는 아니라는 점은 짚고 가자.

— 중국 모델이라 데이터가 걱정돼. 오픈웨이트의 장점이 바로 거기 있어 — 가중치를 직접 내려받아 자기 서버에서 돌리면, API처럼 데이터가 외부로 나가지 않아. 다만 모델 자체의 편향이나 라이선스 조항은 별개로 따져봐야 해. '오픈이라 안전'과 '오픈이라 검증 필요'는 동시에 참이야.

참고 자료

수치는 발표 시점 기준이라 바뀔 수 있어.

관련 기사

무료 뉴스레터

AI 트렌드를 앞서가세요

매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.

매일 30개+ 소스 분석 · 한국어/영어 이중 언어광고 없음 · 1-클릭 해지