spoonai
TOPAnthropicClaudeAI Safety

Claude가 Anthropic 코드의 80%를 쓴다 — 그리고 다리오는 '브레이크 페달'을 달자고 했어

Anthropic이 6월 초 공개한 보고서에 따르면 자체 프로덕션 코드의 80% 이상을 Claude가 직접 쓰고 있어. AI가 AI를 만드는 자기 개선 루프가 현실이 되자, CEO 다리오 아모데이는 '검증 가능한 글로벌 속도 조절 장치'를 만들자고 공개 제안했어.

·9분 소요
공유
Anthropic 'Code with Claude' 행사 사이니지와 참가자 실루엣
출처: Tom's Hardware

AI가 자기 코드를 쓰기 시작하면, 누가 운전대를 잡고 있는 걸까

2026년 6월 초, Anthropic이 'When AI Builds Itself(AI가 스스로를 만들 때)'라는 제목의 내부 보고서를 공개했어. 핵심 수치 하나가 업계를 멈춰 세웠지. 지난 5월 한 달 동안 Anthropic의 프로덕션 코드베이스에 병합된 코드 가운데 80% 이상을 Claude가 직접 작성했다는 거야. Claude Code가 처음 나온 2025년 2월만 해도 이 비율은 한 자릿수에 불과했어. 1년 조금 넘는 사이에 한 자릿수에서 80%대로 뛴 거지.

더 무서운 건 속도야. Anthropic이 내부에서 추적하는 가장 어려운 코딩 과제에서 Claude의 성공률은 5월 기준 76%였어. 불과 6개월 전엔 26% 수준이었거든. 반년 만에 50%포인트가 올랐다는 건, 점진적 개선이 아니라 계단을 한 칸 통째로 뛰어오른 거나 마찬가지야. AI가 AI를 더 잘 만들고, 더 잘 만들어진 AI가 다시 자기를 개선하는 — 이른바 '재귀적 자기 개선(recursive self-improvement)' 루프가 더 이상 이론이 아니라는 신호인 거지.

그리고 이 보고서가 나온 직후, CEO 다리오 아모데이(Dario Amodei)가 공개적으로 입을 열었어. 요지는 단순해. "지금 우리는 액셀만 밟고 있는데, 브레이크 페달이 어디 있는지조차 모른다." 그는 전 세계가 검증 가능한 방식으로 프론티어 AI 개발 속도를 늦출 수 있는 '옵션'을 지금 만들어둬야 한다고 주장했어. 자기 회사가 가장 빠르게 달리는 차를 만들면서, 동시에 "다 같이 브레이크 다는 법을 합의하자"고 말한 거야. 이 모순적인 메시지가 바로 이 뉴스의 핵심이야.

등장인물 — Anthropic, Claude, 그리고 다리오의 두 얼굴

첫 번째 주인공은 Anthropic 자신이야. AI 안전(safety)을 회사의 존재 이유로 내세운 곳인데, 동시에 Claude라는 프론티어 모델로 OpenAI·Google과 정면 경쟁하는 회사이기도 해. 이 두 정체성은 늘 긴장 관계에 있었어. '안전하게 가자'와 '경쟁에서 이기자'는 종종 반대 방향을 가리키거든. 이번 보고서는 그 긴장을 회사 스스로 수면 위로 끌어올린 사건이야.

두 번째 주인공은 Claude, 정확히는 Claude Code야. 단순히 코드 자동완성을 해주는 도구가 아니라, 이슈를 받아서 설계하고, 코드를 쓰고, 테스트를 돌리고, 리뷰까지 거쳐 실제 프로덕션에 병합되는 코드를 만들어내는 에이전트지. Anthropic 엔지니어들의 역할은 점점 '코드를 쓰는 사람'에서 'AI를 감독하는 사람'으로 바뀌고 있어. 보고서가 묘사하는 풍경은 이래. 사람은 방향을 정하고 경계선을 긋고, 실제 타이핑의 대부분은 모델이 한다.

세 번째 주인공은 다리오 아모데이 본인이야. 그는 원래 OpenAI의 연구 부문을 이끌다가 안전 철학의 차이로 나와 Anthropic을 세운 사람이야. 그동안에도 'AI가 2027년쯤이면 대부분의 인간 작업을 능가할 수 있다'는 식의 공격적인 전망을 내놓곤 했지. 이번엔 그 전망에 안전 장치를 붙였어. "강력한 AI는 정부나 기업 하나가 단독으로 완전히 신뢰할 수 있을 만큼 안전하지 않을 수 있다"며, 항공기 인증처럼 강제적인 기술 테스트와 감사를 의무화하고, 고위험 배포를 막거나 되돌릴 수 있는 권한을 정부에 주자고 했어.

핵심 내용 — '80%'라는 숫자가 진짜 뜻하는 것

먼저 오해를 풀자. "Claude가 코드의 80%를 쓴다"는 건 Anthropic 엔지니어가 일을 안 한다는 뜻이 아니야. 오히려 사람의 일이 더 어려워졌다고 보는 게 맞아. 방향 설정, 아키텍처 결정, 무엇을 만들지 말지를 판단하는 '고차원 의사결정'은 여전히 사람 몫이거든. 다만 그 결정을 코드로 옮기는 '구현' 단계가 거의 모델로 넘어간 거야. 키보드를 두드리는 노동에서, 모델을 지휘하고 검수하는 감독으로 무게중심이 이동한 거지.

이게 왜 위험 신호로 읽히느냐면, '개발 속도' 자체가 AI 능력에 묶여버리기 때문이야. 예전엔 더 좋은 AI를 만들려면 더 많은 엔지니어, 더 많은 시간이 필요했어. 인간의 물리적 한계가 일종의 속도 제한 장치였지. 그런데 코드의 80%를 AI가 쓰면, 다음 버전 AI를 만드는 속도도 AI 성능에 비례해서 빨라져. 성능이 좋아질수록 다음 성능을 더 빨리 끌어올리는 — 양의 피드백 루프가 생기는 거야.

항목 내용
보고서 제목 When AI Builds Itself (2026년 6월 초)
자체 코드 작성 비율 80%+ (2025년 2월엔 한 자릿수)
어려운 과제 성공률 76% (6개월 전 ~26%)
핵심 개념 재귀적 자기 개선(recursive self-improvement)
다리오의 제안 검증 가능한 글로벌 속도 조절 옵션
비유 항공기 인증급 기술 테스트·감사 의무화
연구자 Marina Favaro, Jack Clark

Anthropic의 연구자 마리나 파바로(Marina Favaro)와 잭 클락(Jack Clark)은 보고서에서 이렇게 적었어. 만약 전 세계가 프론티어 개발을 함께 늦춘다면 "그건 아마 좋은 일일 것"이라고. 단, 조건이 붙어. 미국과 중국의 연구소, 그리고 프론티어에 근접한 다른 모든 곳이 '외부에서 검증 가능한 규칙' 아래에서 동시에 멈춰야만 의미가 있다는 거야. 혼자만 멈추면 경쟁에서 지고, 멈춘 척만 하면 속이는 쪽이 이기니까.

핵심은 '검증 가능성(verifiability)'이야. 핵무기 군축에서 양국이 서로의 시설을 사찰하듯, AI에서도 '정말 속도를 늦췄는지'를 제3자가 확인할 수 있어야 합의가 작동해. 다리오의 제안은 사실상 'AI판 군축 검증 체계'를 미리 설계해두자는 거야. 지금 당장 멈추자는 게 아니라, 멈춰야 할 때 멈출 수 있는 버튼을 지금 만들어두자는 거지.

각자의 이득 — 누가 왜 이걸 말하나

Anthropic 입장에서 이 보고서는 양날의 검이야. 한쪽 날은 '우리 모델 진짜 세다'는 강력한 마케팅이지. 자기 코드의 80%를 자기가 쓴다는 건 Claude Code가 실전에서 얼마나 강한지를 보여주는 가장 설득력 있는 증거거든. 엔터프라이즈 고객한테 "우리가 직접 그 정도로 쓰고 있다"는 말보다 센 세일즈 멘트는 없어.

다른 쪽 날은 안전 브랜딩이야. Anthropic은 늘 '책임감 있는 프론티어 랩'이라는 포지션으로 차별화해왔어. 가장 빠른 차를 만들면서 동시에 "브레이크 답시다"라고 외치는 건, 규제 논의에서 주도권을 쥐는 전략이기도 해. 규칙이 어차피 만들어질 거라면, 그 규칙을 자기가 설계하는 쪽이 유리하니까. 비판적으로 보면 '규제 포획(regulatory capture)' 우려도 있어 — 안전을 명분으로 만든 진입 장벽이 후발 주자와 오픈소스 진영을 막는 효과를 낼 수 있거든.

다리오 개인에게도 이 메시지는 일관성을 지키는 일이야. 그는 수년간 'AI가 곧 엄청나게 강력해진다'고 말해왔어. 그 말이 맞다면, 그렇게 강력한 걸 아무 안전장치 없이 풀어두자고 할 순 없잖아. 자기 예측에 책임을 지는 형태로, 강력함과 위험을 동시에 인정하는 거지. 물론 회의론자들은 "강력하다는 주장 자체가 투자 유치용 과장 아니냐"고 보기도 해. 둘 다 일리가 있어서, 이 뉴스를 어떻게 읽느냐가 곧 AI 산업을 보는 관점이 돼.

과거 유사 사례 — 멈추자는 외침의 성공과 실패

'AI 속도 조절' 외침은 이번이 처음이 아니야. 2023년 봄, 일론 머스크를 포함한 수천 명이 서명한 'AI 6개월 모라토리엄' 공개서한이 있었어. 결과는? 아무도 멈추지 않았어. 서명한 사람들 중 일부는 오히려 그 사이에 새 AI 회사를 차렸지. 강제력 없는 자발적 멈춤이 경쟁 환경에서 왜 작동하지 않는지를 보여준 대표적 실패 사례야. 다리오의 '검증 가능한 동시 멈춤' 제안은 바로 이 실패를 의식한 설계라고 볼 수 있어.

반대로 어느 정도 작동한 사례도 있어. 항공 산업의 안전 인증 체계야. 비행기는 띄우기 전에 강제적인 기술 테스트와 감사를 통과해야 하고, 문제가 생기면 기종 전체를 멈춰 세울 수 있어. 다리오가 굳이 '항공기'를 비유로 든 이유가 여기 있어. 혁신을 죽이지 않으면서도 치명적 실패를 막는, 작동하는 규제 모델이 이미 존재한다는 거지. 다만 항공은 사고의 인과관계가 명확하고 검증 기술이 성숙했는데, AI는 '무엇이 위험한 실패인지' 정의부터가 논쟁적이라는 게 큰 차이야.

또 하나 떠올릴 만한 건 핵 분야의 IAEA(국제원자력기구) 사찰 체계야. 적대국 사이에서도 '서로 확인 가능한 검증'이 있으면 합의가 유지될 수 있다는 걸 보여준 모델이지. 다리오의 비전은 사실상 'AI판 IAEA'에 가까워. 문제는, 핵은 우라늄 농축 시설처럼 물리적으로 추적 가능한 대상이 있는데, AI는 데이터센터의 GPU 클러스터 정도가 그나마 추적 가능한 물리적 흔적이라는 점이야. 소프트웨어의 진척을 어떻게 사찰할 것인가 — 이게 미해결 난제로 남아 있어.

경쟁자 카운터 플레이 — OpenAI와 오픈소스는 어떻게 받아칠까

OpenAI 입장에선 이 메시지가 불편할 수 있어. Anthropic이 '안전한 프론티어 랩'의 깃발을 다시 흔들면, 상대적으로 OpenAI는 '속도만 내는 쪽'으로 비치기 쉽거든. 하지만 OpenAI도 자기 나름의 안전 프레임워크를 갖고 있고, 'AI를 최대한 많은 사람에게 빠르게 보급하는 것 자체가 안전'이라는 논리로 맞설 수 있어. 멈추자는 게 아니라 더 널리 퍼뜨려 사회가 적응하게 하자는 반론이지.

중국 진영의 반응은 또 달라. 다리오의 제안은 '미국과 중국이 동시에 멈춰야 의미가 있다'는 전제 위에 서 있어. 그런데 중국 입장에선 "왜 앞서가는 미국이 만든 규칙에 우리가 발을 맞춰야 하느냐"는 의심이 자연스러워. Moonshot, DeepSeek 같은 중국 오픈웨이트 진영이 빠르게 추격하는 상황에서, '동시 멈춤'은 추격자에겐 손해, 선두에겐 이득으로 비칠 수 있어. 이 지정학적 비대칭이 다리오 제안의 가장 큰 현실적 장벽이야.

오픈소스 진영의 반발도 만만치 않을 거야. '고위험 AI 배포를 정부가 막거나 되돌릴 수 있게 하자'는 제안은, 누구나 모델을 내려받아 돌릴 수 있는 오픈웨이트 철학과 정면충돌하거든. 모델 가중치가 한번 인터넷에 풀리면 '되돌리기' 자체가 물리적으로 불가능해. 그래서 오픈소스 진영은 이런 제안을 '폐쇄형 거대 랩이 자기 해자를 지키려는 규제'라고 비판할 여지가 커. 같은 'AI 안전'이라는 단어를 두고도, 폐쇄형과 개방형 진영이 정반대 결론에 도달하는 구조야.

그래서 뭐가 달라지는데 — 입장별로 보면

개발자라면, 당장 체감하는 변화는 '에이전트한테 일을 통째로 맡기는 워크플로'가 더 이상 실험이 아니라 표준이 되어간다는 거야. Anthropic이 자기 코드의 80%를 그렇게 쓰고 있다면, 너의 팀도 머지않아 비슷한 방식으로 일하게 될 가능성이 커. 키보드 타이핑 실력보다 '무엇을 만들지 정의하고, AI 결과물을 검수하고, 경계선을 긋는 능력'이 더 중요해지는 거지. 일자리가 사라진다기보단, 일의 성격이 '구현자'에서 '감독자'로 바뀐다고 보는 게 정확해.

창업자·기업 의사결정자라면, 규제 리스크를 미리 읽어둘 필요가 있어. 다리오의 제안이 그대로 법이 될 가능성은 낮지만, 'AI 안전 인증'이라는 개념이 정책 테이블에 오르는 흐름은 분명해졌어. 한국·EU처럼 이미 사전 규제를 도입한 곳도 있고. 프론티어급 모델을 직접 학습시키는 회사라면 향후 기술 감사·테스트 의무가 비용으로 잡힐 수 있다는 걸 시나리오에 넣어두는 게 좋아.

일반 사용자라면, 이 뉴스는 '내가 쓰는 AI가 점점 더 빨리, 더 세지고 있다'는 신호로 읽으면 돼. 동시에 그 발전 속도를 만드는 회사조차 "브레이크가 필요하다"고 말하는 상황이라는 것도 기억해둘 만해. 패닉할 일은 아니지만, AI를 '그냥 편한 도구'로만 보던 시각을 한 단계 업데이트할 때가 됐다는 정도의 신호로 받아들이면 충분해.

🥄 남은 궁금증 세 가지

— 그래서 AI가 진짜 통제 불능이 되는 거야? 단정하긴 일러. 보고서가 말하는 건 '통제 불능'이 아니라 '통제하기 점점 어려워질 수 있는 조건'이 만들어지고 있다는 경고야. 80% 코드 작성은 능력의 증거지, 의도나 자율성의 증거가 아니거든. 다만 개발 속도가 인간의 검증 속도를 추월하기 시작하면 위험이 커진다는 논리는 새겨들을 만해.

— Anthropic이 진심일까, 마케팅일까? 솔직히 둘 다일 거야. 안전 메시지가 진심인 동시에, 그게 Anthropic의 가장 강력한 차별화 전략이라는 것도 사실이야. 둘이 모순되지 않아. '우리 모델이 그만큼 세다'와 '그래서 규칙이 필요하다'는 같은 동전의 양면이거든. 진정성과 이해관계를 굳이 분리하려 들기보단, 둘이 겹쳐 있다는 걸 인정하고 보는 게 더 정확해.

— 이 제안이 실제로 실현될 가능성은? 가까운 시일 안엔 낮아. 미·중 동시 멈춤이라는 전제가 지정학적으로 너무 어렵거든. 다만 '검증 가능한 안전 인증'이라는 아이디어 자체는 살아남아서, 부분적인 형태로 각국 규제에 스며들 가능성은 있어. 전면적 모라토리엄보다는, 항공 인증 비슷한 단계적 의무화가 현실적인 착지점일 거야.

참고 자료

수치는 발표 시점 기준이라 바뀔 수 있어.

관련 기사

무료 뉴스레터

AI 트렌드를 앞서가세요

매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.

매일 30개+ 소스 분석 · 한국어/영어 이중 언어광고 없음 · 1-클릭 해지