spoonai
TOPAnthropicClaudeAI Safety

Fable 5·Mythos 5, 정부 명령에 꺼진 지 14일째 — 그 사이 OpenAI가 빈자리를 채웠다

Anthropic의 Claude Fable 5와 Mythos 5가 미국 정부의 수출통제 지침으로 강제 비활성화된 지 6월 26일로 14일째야. 익명 사용자의 '좁은 탈옥' 하나가 발단이 돼 모든 해외 국적자 접근이 막혔고, Anthropic은 명령은 따르면서도 정면 반박했어. 그 빈틈을 노려 OpenAI는 GPT-5.5-Cyber로 Mythos 5를 추월했다고 발표했어. 모델이 '정책'으로 꺼질 수 있다는 걸 보여준 사건이야.

·9분 소요
공유
AI 데이터센터 GPU 서버랙
Unsplash

AI 모델이 '버그' 때문이 아니라 '정부 명령'으로 꺼졌다

자, 핵심부터. Anthropic의 최상위 모델 Claude Fable 5와 Mythos 5가, 미국 정부의 수출통제 지침으로 강제 비활성화된 지 6월 26일로 14일째야. 서버가 터진 것도, 버그가 난 것도 아니야. 정부가 "이 모델을 해외 국적자에게 제공하지 마라"고 명령했고, Anthropic이 그걸 이행하느라 모든 고객에게 두 모델을 통째로 내린 거야.

발단은 의외로 작아. 6월 10일, X에서 'Plenty the Liberator(플렌티 더 리버레이터)'라는 익명 사용자가 Fable 5의 탈옥(jailbreak) 방법을 올렸어. 그러자 6월 12일 오후 5시 21분(미 동부시간), 미 정부가 국가안보 권한을 근거로 수출통제 지침을 하달했지. 미국 안에 있든 밖에 있든, 외국 국적자 — 심지어 Anthropic의 외국인 직원까지 — 의 Fable 5·Mythos 5 접근을 전부 차단하라는 내용이었어.

왜 이게 큰 뉴스냐. 이건 단순한 다운타임이 아니라, AI 모델이 '정책 리스크'로 하루아침에 사라질 수 있다는 걸 처음으로 똑똑히 보여준 사건이기 때문이야. 그동안 우리는 'AI는 약관 위반이나 안전 문제로 막힐 수 있다'고 생각했지, '정부 한 통의 지침으로 전 세계 고객의 모델이 동시에 꺼진다'는 시나리오는 막연했거든. 그 막연한 게 현실이 됐어.

그래서 오늘 풀 이야기는 이거야. 정확히 무슨 일이 있었는지, Anthropic은 왜 명령을 따르면서도 동시에 반박했는지, 이 14일의 공백 동안 경쟁사 OpenAI가 어떻게 움직였는지, 그리고 'AI를 쓰는 우리'에게 이게 무슨 의미인지. 등장인물부터 잡자.

등장인물 — Anthropic, 미국 정부, 그리고 익명의 탈옥러

먼저 Anthropic. Claude를 만드는 AI 안전 중심 회사야. 역설적인 건, '안전'을 가장 앞세워 온 회사가 '안전 우려'를 이유로 자기 최상위 모델을 강제로 내려야 했다는 점이야. Anthropic은 명령을 즉각 이행해 두 모델을 비활성화했지만, 동시에 공식 성명에서 정부의 판단에 정면으로 이견을 냈어. '준수하되 동의하지는 않는다'는 미묘한 자세지.

다음은 미국 정부. 구체적으로 어느 부처가 주도했는지는 공개되지 않았지만, 핵심은 '수출통제·국가안보' 프레임을 AI 모델에 적용했다는 거야. 지금까지 수출통제는 주로 칩 같은 하드웨어에 걸렸는데, 이번엔 'AI 모델 접근 자체'를 통제 대상으로 삼았어. AI가 전략 물자처럼 다뤄지기 시작했다는 신호야.

세 번째는 'Plenty the Liberator'라는 익명의 탈옥러. X에 Fable 5 탈옥법을 공개한 장본인이야. Anthropic의 설명에 따르면, 이 탈옥은 '좁고 비보편적'이며, 모델에게 특정 코드베이스를 읽고 소프트웨어 결함을 고치라고 요청하는 방식이라고 해. 한 명의 게시물이 정부를 움직이고, 정부가 수억 명이 쓰는 모델을 내리게 만든 — 나비효과의 교과서 같은 사건이야.

이 셋의 관계를 한 문장으로 묶으면 이래. 익명의 탈옥 공개 하나가 정부의 국가안보 지침을 촉발했고, 그 지침이 AI 안전을 표방하는 회사로 하여금 자기 최상위 모델을 14일째 꺼두게 만들었다. 이게 이야기의 뼈대야.

핵심 내용 — 무엇이 일어났나

말로 풀면 흩어지니까, 확인된 사실을 타임라인 표로 보자.

시점 사건
6월 10일 'Plenty the Liberator'가 X에 Fable 5 탈옥법 게시
6월 12일 17:21 ET 미 정부, 수출통제 지침 하달 — 외국 국적자 접근 전면 차단 명령
6월 12일 Anthropic, Fable 5·Mythos 5 즉시 비활성화
6월 13일 CNBC·Fortune 등 주요 매체 보도, 파장 확산
6월 25일 OpenAI, GPT-5.5-Cyber가 CyberGym 85.6%로 Mythos 5 추월 발표
6월 26일 비활성화 14일째 — 복구 시점 여전히 미공개

표를 한 줄씩 보자. 우선 '외국 국적자 전면 차단'의 범위가 무서워. 단순히 특정 국가를 막은 게 아니라, 미국 안에 사는 외국인, 심지어 Anthropic 내부의 외국 국적 직원까지 포함했어. 그래서 Anthropic은 '특정 사용자만 거른다'는 정밀 차단이 현실적으로 어려워, 결국 모든 고객에게 두 모델을 통째로 내리는 선택을 했어. 한 줄의 명령이 '전부 차단'으로 번진 거지.

두 번째로 Anthropic의 반박 논리가 핵심이야. Anthropic은 "좁은 잠재적 탈옥의 발견이, 수억 명에게 배포된 상업 모델을 회수할 근거가 된다는 데 동의하지 않는다"고 공개적으로 못 박았어. 게다가 정부가 제시한 증거는 '구두(verbal)'였다고 밝혔어. 문서화된 기술 증거 없이 말로 전달된 우려만으로 최상위 모델 두 개가 내려간 거야. 절차의 투명성을 두고 논쟁이 붙을 수밖에 없는 대목이야.

세 번째로 다른 모델은 멀쩡하다는 점도 중요해. 이번 차단은 Fable 5와 Mythos 5, 두 최상위 모델에만 적용됐고 다른 Claude 모델 접근은 영향이 없었어. 즉 정부의 우려가 '가장 강력한 프런티어 모델의 사이버 능력'에 집중돼 있다는 뜻이야. 모델이 셀수록 통제의 표적이 된다는, AI 안전 정책의 새 문법을 보여주는 거지.

각자의 이득 — 누가 뭘 얻고 잃나

미국 정부의 입장부터 보자. 정부가 얻는 건 '강력한 프런티어 모델의 사이버 악용 가능성'을 선제적으로 차단했다는 안보적 명분이야. 탈옥을 통해 모델이 코드 취약점을 자동으로 찾고 고치는 능력이 악용되면, 사이버 공격 도구가 될 수 있다는 우려지. 다만 잃는 것도 있어. 절차의 불투명성과 '구두 증거'라는 약한 근거는, 정부의 AI 개입이 자의적일 수 있다는 비판을 자초했어.

Anthropic의 손익은 복잡해. 손해는 명백해. 최상위 모델 두 개가 2주간 매출을 못 내고, 그 자리를 경쟁사에 내줬어. 하지만 묘하게 얻는 것도 있어. '명령은 따르되 공개적으로 이견을 냈다'는 스탠스는, Anthropic을 '정부에 굴종하지 않고 사용자 편에서 절차적 정당성을 따지는 회사'로 포지셔닝해. 안전을 표방해 온 회사로서 신뢰의 결을 지킨 셈이야.

그리고 가장 분명한 수혜자는 OpenAI야. Mythos 5가 사이버 보안 벤치마크에서 비워둔 자리를, OpenAI는 6월 25일 GPT-5.5-Cyber가 CyberGym에서 85.6%를 기록하며 추월했다고 발표했어. 경쟁사가 규제로 발이 묶인 바로 그 순간, 같은 영역의 특화 모델로 '이제 최강은 우리'라고 깃발을 꽂은 거야. 타이밍이 절묘하다 못해 잔인할 정도지.

과거 유사 사례 — 성공과 실패

비슷한 결의 사건을 떠올려 보면, 가장 먼저 칩 수출통제가 있어. 미국은 첨단 GPU의 대중국 수출을 국가안보를 이유로 단계적으로 막아 왔어. '전략 기술은 통제 대상'이라는 논리가 하드웨어에 적용된 대표 사례지. 이번 Fable·Mythos 건은 그 논리가 처음으로 '소프트웨어 모델 접근'까지 확장된 순간이라, 칩 통제의 역사를 AI가 그대로 밟아가고 있다고 볼 수 있어.

또 하나는 암호화 기술의 수출통제 역사야. 1990년대 미국은 강력한 암호화 소프트웨어를 '군수품'으로 분류해 수출을 막았어. 결국 기술 확산을 완전히 막진 못했고, 규제는 점차 완화됐지. 이 사례가 주는 교훈은, '코드는 결국 퍼진다'는 거야. 탈옥법이 이미 공개된 상황에서 모델만 내린다고 위험이 사라지느냐는 회의론이 나오는 이유야.

반대로 '선제 차단이 통한' 사례도 있어. 안전상 우려로 특정 기능을 빠르게 비활성화해 더 큰 사고를 막은 플랫폼들의 경험이야. 핵심은 '속도'와 '복구 능력'이야. 빠르게 내리고, 원인을 좁게 특정하고, 신속히 되살리면 신뢰를 지킬 수 있어. 14일째 복구 시점조차 안 나온 이번 건이 우려스러운 건, 바로 이 '복구'가 안 보이기 때문이야.

경쟁자 카운터 플레이

이미 움직인 OpenAI의 카운터는 명확해 — 빈자리를 사이버 보안 특화 모델로 채우는 거야. GPT-5.5-Cyber의 CyberGym 85.6%는 '규제로 흔들리지 않는 안정적 공급자'라는 메시지를 시장에 던져. 기업 보안팀 입장에선 '규제로 갑자기 꺼질 수 있는 모델'보다 '계속 켜져 있는 모델'을 택하는 게 합리적이거든. 공급 안정성 자체가 경쟁력이 된 거야.

**구글(DeepMind)**의 카운터는 좀 더 조용할 거야. Gemini 진영은 이번 사태를 '거버넌스 안정성'을 강조하는 기회로 쓸 수 있어. '우리 모델은 정부와의 협의 채널이 탄탄해 갑작스러운 중단 리스크가 낮다'는 식의 안정성 마케팅이지. 직접 비방보다는, 자기 모델의 예측 가능성을 부각하는 우회로를 택할 가능성이 커.

그리고 오픈소스·자체 호스팅 진영이 의외의 반사이익을 봐. '클라우드 API 모델은 정부 명령 한 통에 꺼질 수 있다'는 게 증명된 이상, 보안이 중요한 기업과 기관은 '내가 직접 돌리는 모델'의 가치를 다시 보게 돼. 통제 불가능한 외부 의존을 줄이려는 수요가, 가중치를 직접 받는 오픈 모델 쪽으로 일부 흘러갈 수 있어.

그래서 뭐가 달라지는데

Claude 최상위 모델을 쓰던 기업·개발자라면 지금 당장은 대안 모델로 갈아탈 수밖에 없어. 그리고 교훈은 분명해 — '단일 모델 종속'은 리스크라는 거야. 핵심 워크플로를 한 모델에만 묶어두면, 그 모델이 규제로 꺼지는 순간 사업이 멈춰. 복수 모델을 병행할 수 있게 추상화 계층을 두는 설계가, 이제 선택이 아니라 보험이 됐어.

AI 안전·정책에 관심 있다면 이 사건은 결정적 선례야. '정부가 어떤 절차로, 어떤 증거로 AI 모델을 내릴 수 있는가'라는 질문이 처음으로 실전에서 던져졌거든. 구두 증거만으로 가능한가, 사후 검증과 복구 기준은 무엇인가 — 이 논쟁의 결론이 앞으로 AI 거버넌스의 틀을 짤 거야. 지금은 그 틀이 만들어지는 첫 장면이야.

일반 사용자라면 직접 영향은 작아. 무료로 쓰는 Claude는 멀쩡하니까. 다만 한 가지는 기억해 둘 만해 — 가장 강력한 AI일수록 '늘 켜져 있을 거라는 보장'이 약해지고 있다는 거야. 편리함의 이면에, '정책으로 사라질 수 있는 도구'라는 새로운 불확실성이 들어왔어.

한 걸음 더 — '구두 증거'와 14일이 남긴 질문

이 사건의 가장 불편한 핵심은 '구두 증거'야. 정부가 문서화된 기술 분석이 아니라 말로 전달한 우려만으로 최상위 모델 두 개가 내려갔다는 건, 절차적으로 큰 구멍을 드러내. 만약 이게 선례가 되면, 앞으로 어떤 모델이든 '검증 가능한 증거 없이' 행정 판단만으로 멈출 수 있다는 얘기가 돼. AI 기업 입장에선 '언제, 무엇 때문에 꺼질지 모른다'는 예측 불가능성이 가장 큰 사업 리스크로 떠오르는 거지. Anthropic이 굳이 공개적으로 이견을 낸 건, 이 선례의 무게를 알기 때문이야.

두 번째로 곱씹어야 할 건 '비대칭 피해'야. 탈옥법은 이미 X에 공개돼 누구나 볼 수 있는데, 정작 차단된 건 합법적으로 모델을 쓰던 수억 명의 정상 사용자야. 악용하려는 사람은 다른 경로를 찾고, 선량한 사용자만 접근을 잃는 구조라면, 이 조치가 실제 위험을 얼마나 줄였는지 따져봐야 해. 보안에서 흔히 말하는 '보여주기식 통제(security theater)'가 아니냐는 비판이 나오는 이유야. 물론 정부는 '최악의 시나리오를 막는 게 우선'이라는 다른 저울을 들고 있고, 이 두 저울 사이의 긴장이 이 사건의 본질이야.

세 번째는 '14일'이라는 시간 자체의 무게야. 하루 이틀의 비상 조치라면 이해할 수 있지만, 복구 시점조차 안 나온 채 2주가 흘렀다는 건 다른 문제야. 기업 고객은 그 사이 워크플로를 다른 모델로 옮겨야 했고, 한 번 이탈한 고객이 모델이 돌아온다고 즉시 복귀한다는 보장은 없어. 즉 이 14일은 매출 손실을 넘어, 시장 점유율의 영구적 이동을 만들 수 있는 시간이야. OpenAI가 그 틈을 정확히 파고든 게 우연이 아니지.

그래서 이 사건은 단순한 '규제 vs 기업' 대립을 넘어, AI 거버넌스의 미완성 규칙을 적나라하게 드러낸 시험대야. 정부가 모델을 내릴 권한이 있다는 데까진 많은 이가 동의해도, '어떤 증거로, 어떤 절차로, 얼마 동안, 누가 복구를 결정하는가'라는 세부는 아직 백지야. 이번 Fable·Mythos 건의 결말이, 그 백지에 처음으로 글자를 새기게 될 거야.

🥄 남은 궁금증 세 가지

— 그래서 Fable 5·Mythos 5 언제 돌아와? 아직 아무도 몰라. Anthropic은 "최대한 빨리 복구하겠다"고만 했고, 14일째인 지금도 구체적 시점은 안 나왔어. 정부 판단에 달려 있어서 Anthropic 혼자 정할 수 있는 문제가 아니라는 게 핵심이야.

— 탈옥법은 이미 공개됐는데 모델만 내리면 의미 있어? 바로 그게 Anthropic의 반박 포인트야. '좁은 탈옥' 하나로 수억 명의 모델을 내리는 게 비례에 맞느냐는 거지. 위험을 줄이는 효과가 있는지, 아니면 상징적 조치에 그치는지는 솔직히 단정하기 일러.

— 다른 회사 모델도 이렇게 갑자기 꺼질 수 있어? 이론상 가능해진 거야. 이번이 첫 선례인 만큼, 같은 프레임이 다른 프런티어 모델에도 적용될 수 있어. 그래서 '한 모델에만 올인하지 마라'가 이 사건의 가장 실용적인 교훈이야.

참고 자료

수치는 발표 시점 기준이라 바뀔 수 있어.

관련 기사

무료 뉴스레터

AI 트렌드를 앞서가세요

매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.

매일 30개+ 소스 분석 · 한국어/영어 이중 언어광고 없음 · 1-클릭 해지