Anthropic, Claude Opus 4.7과 금융 에이전트 10종 공개 — 월가 일감을 통째로 가져가러 왔어
Anthropic이 5월 5일 뉴욕 금융 브리핑에서 Claude Opus 4.7과 사전 빌드된 금융 에이전트 10종을 공개했어. JPMorgan·Goldman·Citi·AIG·Visa가 이미 프로덕션. M365 add-in과 Moody's 데이터 통합까지. 월가 백오피스가 통째로 재구성되는 시작점이야.

월가 백오피스 풀 스택을 가져오는 첫 신호 — 5월 5일 뉴욕
5월 5일 뉴욕, Anthropic이 금융 서비스 전용 비공개 브리핑을 열었어. 자리에 모인 건 JPMorganChase, Goldman Sachs, Citi, AIG, Visa, Bridgewater 같은 월가 톱티어. 이 자리에서 Anthropic은 두 가지를 동시에 공개했어. 첫째, Claude Opus 4.7 — 금융 워크플로 전용으로 튜닝된 신모델. 둘째, 금융 에이전트 10종 — pitchbook 생성, KYC 스크리닝, 월말 결산 같은 가장 시간 잡아먹는 백오피스 작업을 자동화하는 사전 빌드 템플릿.
핵심 숫자는 이거야. Opus 4.7은 Vals AI Finance Agent 벤치마크에서 64.4%로 1위. 같은 자리에서 GDPval-AA(경제적 가치 있는 지식 노동을 측정하는 벤치)도 톱. JPM CEO 제이미 다이먼은 같은 주에 별건 인터뷰에서 "AI가 우리 백오피스를 재정의하는 속도가 코드 작성보다 빠르다"고 명시. 5월 4일에는 Anthropic-Blackstone-Goldman이 $1.5B 규모 PE 조인트벤처를 발표하면서 자본+모델+딜 사이드의 삼각 동맹까지 깔아 놨어.
이 발표가 특별한 이유는 단순 모델 출시가 아니라는 점이야. Anthropic이 "월가 워크플로 OS" 자리를 노리고, 모델 + 에이전트 + 데이터(Moody's) + 디스트리뷰션(M365 add-in)을 한 번에 묶었어. OpenAI/Google이 컨슈머·검색에서 다투는 사이에 Anthropic은 B2B 금융 한 카테고리를 통째로 가져가는 우회로를 짠 거야.
각 주체 — Anthropic, Claude Opus 4.7, 채택 기관
Anthropic. 2026년 5월 기준 ARR이 빠르게 성장 중이라는 게 시장 컨센서스. 매출 구성에서 컨슈머(Claude.ai)보다 API + 엔터프라이즈 비중이 압도적으로 높아. 작년 12월 라운드에서 가치 평가는 1,500억 달러대로 알려졌고, OpenAI와 다르게 "B2B 엔터프라이즈 모델"이라는 포지셔닝을 명확히 잡고 가는 중. 이번 금융 브리핑은 그 포지셔닝의 결정판이야.
Claude Opus 4.7. Sonnet 4.5와 같은 패밀리지만 추론 깊이와 도구 사용 정확도에 집중한 플래그십. Vals AI Finance Agent 벤치 64.4%(2위 GPT-5 약 58%, Gemini 3.1 56% 추정)로 명확한 1위. 컨텍스트 윈도우는 200K 유지, 도구 호출의 멀티 스텝 일관성에서 Sonnet 대비 30% 개선이 발표 자료의 핵심. 가격은 input $15/1M, output $75/1M 추정(Sonnet $3/$15 대비 5배). 즉 "비싼 대신 정확한" 포지셔닝.
금융 에이전트 10종. Anthropic이 직접 빌드해 출시한 건 다음과 같은 카테고리. (1) Pitchbook generation — IB 신입 분석가가 보통 8-12시간 쓰는 작업, (2) KYC/AML 스크리닝, (3) Earnings call 요약 + 비교, (4) Credit memo 생성, (5) Market commentary 자동 생성, (6) Month-end book closing 보조, (7) Compliance email 응대, (8) Loan covenant 모니터링, (9) Regulatory filing 분석, (10) Internal research 정보검색. 각 에이전트는 Claude Opus 4.7 + Anthropic MCP 서버 + 클라이언트 API로 구성돼. 클라이언트는 자기 데이터/시스템에 MCP로 연결만 하면 돼.
채택 기관. 발표 시점에 프로덕션 사용을 공개한 곳은 JPMorganChase(Pitchbook + Credit memo), Goldman Sachs(Pitchbook + Earnings 요약), Citi(KYC + Compliance), AIG(Loan covenant + Credit), Visa(Compliance). Bridgewater는 Internal research에 도입했다고 비공개 브리핑에서 확인. 기관 적용 사례 5곳이 한 번에 발표된 건 엔터프라이즈 AI 역사상 드문 규모.
파트너 데이터/디스트리뷰션. Moody's가 자사 신용·기업 데이터를 Anthropic API로 노출하는 파트너십을 공개. M365 add-in으로 Excel·Outlook·Teams 안에서 직접 호출 가능. 이게 "Anthropic 단독" 베팅이 아니라 "Anthropic + Microsoft + Moody's" 삼각 디스트리뷰션을 만들었다는 의미야.
핵심 내용 — 벤치마크, 가격, 통합 구조
벤치마크. Vals AI Finance Agent는 실제 월가 분석가가 수행하는 25개 워크플로(밸류에이션, 거래 분석, 컴플라이언스 케이스 등)를 측정. Opus 4.7은 64.4%, GPT-5(58% 추정), Gemini 3.1(56% 추정), Llama 4 405B(48% 추정) 대비 명확한 우위. GDPval-AA는 OpenAI가 만든 경제적 가치 있는 지식 노동 벤치인데, Opus 4.7이 같은 데이터셋에서도 1위. 즉 "금융만이 아니라 일반 지식 노동에서도 강하다"는 메시지.
가격과 토큰 효율. Opus 4.7 가격 정책은 명시적으로 "정확도 프리미엄". Sonnet 4.5보다 5배 비싸지만, 멀티 스텝 에이전트에서 재시도 비율이 낮아져서 실제 워크플로 단가는 2-2.5배 수준에 그친다는 게 Anthropic의 주장. JPM 사례에서 Pitchbook 생성 1건당 $15-25 수준에 안착했다고 보고.
| 모델 | Input ($/1M) | Output ($/1M) | Vals AI Finance | 컨텍스트 |
|---|---|---|---|---|
| Claude Opus 4.7 | $15 | $75 | 64.4% | 200K |
| Claude Sonnet 4.5 | $3 | $15 | 56% | 200K |
| GPT-5 | $10 | $40 | ~58% | 256K |
| Gemini 3.1 Ultra | $7 | $35 | ~56% | 2M |
통합 구조. 클라이언트가 도입할 때 5개 레이어를 한 번에 받아. (1) Claude Opus 4.7 모델, (2) 금융 에이전트 10종 템플릿, (3) MCP 서버(자기 데이터 연결용), (4) M365 add-in(직원 디스트리뷰션), (5) Moody's 데이터 액세스. 6개월 PoC 단가가 $5-15M 수준으로 추정되고, 풀 deployment는 3년 $50-100M 단위 계약. 월가 톱 5는 이미 풀 deployment 결정.
컴플라이언스. Anthropic은 같은 자리에서 SOC 2 Type II + ISO 27001 + 금융 규제 적합 vault deployment를 동시 보장. 즉 데이터가 Anthropic 외부로 나가지 않고 클라이언트 VPC 안에서 추론. JPM의 풀 deployment 결정에 결정적이었던 부분.
각자의 이득 — 누가 무엇을 얻나
Anthropic은 ARR 가속과 평가 프리미엄을 얻어. 월가 톱 5 + Moody's + M365 통합은 단일 발표에서 가장 강력한 엔터프라이즈 진입 시그널. 다음 라운드 가치 평가가 2,500-3,000억 달러대로 점프할 명분 확보. 또 OpenAI/Google과 차별화된 "B2B 금융 풀스택" 포지셔닝이 굳어져.
JPM·Goldman·Citi 같은 도입 기관은 백오피스 노동시간 30-50% 절감 시나리오. Pitchbook 한 건당 IB 분석가가 8-12시간 쓰던 게 1-2시간으로. 분석가는 "데이터 가공" 대신 "고객 미팅·딜 협상"에 시간 재배치. 이게 인력 감축으로 갈지, 인당 매출 상승으로 갈지가 다음 12개월의 관전 포인트.
Microsoft는 M365 디스트리뷰션 채널로 OpenAI 외 두 번째 모델 파트너 확보. 5월 5일 발표에서 M365 add-in이 GPT-5와 Claude Opus 4.7을 동시에 호출 가능한 옵션으로 제공된다고 명시. 즉 마이크로소프트는 "단일 모델 베팅"에서 "최고 모델을 골라 쓰는 통합 클라우드"로 포지셔닝 전환. 알파벳 풀스택 내러티브에 대한 카운터 플레이의 일환.
Moody's는 데이터 비즈니스 마진을 두 배로 끌어올릴 기회. 신용 데이터를 Anthropic API에 노출해 토큰당 사용료를 받는 구조면, 고객 한 곳당 $100K-1M 수준 추가 매출. 5년 누적 $5-10B 추가 매출 시나리오.
금융 분석가/주니어 IB는 가장 즉각적 임팩트. 단기 1-2년은 노동시간 절감으로 워라밸 개선, 중기 3-5년은 신입 IB 채용 30-50% 축소 가능성. JPM 이미 신입 채용 가이드를 30% 축소 검토 중이라는 보도가 5월 6일 WSJ에 나옴.
과거 유사 사례 — 블룸버그 1981, 이메일 1990s, 알고 트레이딩 2000s
블룸버그 터미널 1981년. 마이클 블룸버그가 Salomon Brothers에서 시작한 데이터 + 분석 + 디스트리뷰션 통합. 월가 트레이더 데스크에 "터미널 1대 = 직원 1명 = $25K/년"이라는 카테고리를 만들었어. Anthropic 금융 에이전트는 그 패턴의 AI 버전 — 분석가 1명 = Claude 라이선스 1개. 다른 점은 블룸버그가 "데이터를 보여주기"였다면 Claude는 "노동을 대체하기"라는 점. 더 깊은 가치 사슬에 들어가.
이메일/오피스 디지털화 1990s. 월가 백오피스가 종이 → 디지털로 전환되면서 사무직 인력 구조가 30% 축소됐어. 그 자리에 IT/데이터 분석가가 늘었지만 순감소는 분명했어. AI 에이전트는 같은 패턴이 한 단계 더 압축되는 경우 — 디지털화에서 자동화로.
알고리즘 트레이딩 2000s. 인간 트레이더 → 퀀트 + 알고. 골드만 삭스 트레이딩 데스크 인력이 600명 → 2명으로 줄어든 상징적 사례. 다만 같은 시기 매출과 이익은 더 커졌어. AI 에이전트도 똑같이 "백오피스 인력은 줄지만 매출/이익은 더 커지는" 시나리오로 갈 가능성이 가장 높아.
반대 사례: IBM Watson 헬스케어 2014-2022. 의료 AI에 대규모 자본 투입했지만 임상 워크플로에 통합되지 못해 실패. Anthropic 금융 에이전트의 차별점은 (1) 사전 빌드 템플릿 + MCP로 통합 마찰 최소화, (2) Sonnet/Opus 백본의 모델 자체 정확도가 IBM Watson 시절 대비 압도적, (3) 도입 기관이 5곳 동시 공개로 사회적 증명. 그래도 임상 vs 금융의 맥락 차이를 무시할 수 없으니 24개월 후 ROI 입증이 진짜 분기점.
경쟁자 카운터 플레이 — OpenAI·Google·Cohere·로컬 LLM
OpenAI의 카운터. GPT-5 + AgentKit + Operator로 비슷한 풀 스택을 만들고 있고, 5월 6일에는 Bessemer Venture Partners와 함께 "GPT for Finance" 프로그램을 공개. 다만 OpenAI는 마이크로소프트 의존으로 M365 디스트리뷰션을 직접 제어 못 해. Anthropic이 M365 add-in에서 동급 자리를 받은 건 OpenAI 입장에서 직접적 위협. OpenAI의 다음 카드는 ChatGPT Enterprise 안에 금융 에이전트 마켓플레이스 + Stripe Atlas 통합 결제로 풀 스택 강화.
Google의 카운터. Gemini 3.1 Ultra + Vertex AI Agent Builder + Google Cloud Financial Services 묶음. 다만 월가 디스트리뷰션이 약하고, M365 같은 업무 도구 통합이 없어. Google의 카운터는 "Workspace + Gemini로 데이터/문서 통합"을 무기로 미드마켓 자산운용사·은행 공략. 5월 8일에는 Charles Schwab과 Gemini Vertex 통합 계약 발표(WSJ).
Cohere/Mistral 같은 엔터프라이즈 LLM. Cohere는 5월 9일 RBC, Bank of America와의 protected-data deployment 확장 발표로 대응. 데이터 보안과 가격에서 차별화. Mistral은 유럽 은행(BNP Paribas, ING)과의 풀 스택 deployment를 강조하는 지역 차별화 전략.
JPM의 자체 LLM (LLM Suite, IndexGPT). JPM은 Anthropic을 도입하면서도 자체 LLM을 병행. 멀티-프로바이더 전략의 표본. 한 회사가 한 모델에 100% 락인되지 않는다는 메시지가 다른 은행들의 도입 결정도 가속화.
로컬 LLM (Llama 4 405B 파인튜닝). 데이터를 한 줌도 외부에 안 보내고 싶은 헤지펀드/PE는 Llama 4를 자체 파인튜닝. Anthropic 대비 정확도는 떨어지지만 데이터 통제 면에서 우위. Citadel, Two Sigma가 이 방향.
그래서 뭐가 달라지는데 — 페르소나별
금융 분석가/주니어 IB: 6-12개월 안에 Pitchbook·Credit memo·Earnings 요약을 Claude로 100% 자동화하는 기관이 늘어나. 노동시간 30-50% 절감되지만, "분석가 헤드카운트 30% 축소"라는 시나리오가 동시에 진행. 살아남는 분석가는 (1) 모델 출력을 검증·교정하는 사람, (2) 고객 관계·딜 협상에 강한 사람. "엑셀 잘하는 사람"의 가치는 빠르게 휘발돼.
CTO/엔지니어링 리더: MCP 서버를 자체 데이터/시스템에 연결하는 게 12개월 내 핵심 인프라 작업으로 떠오름. Snowflake, Databricks, internal data warehouse를 MCP로 노출하는 작업이 우선순위. 같은 패턴이 헬스케어·법률·컨설팅으로 빠르게 확산.
규제 당국(SEC, FRB, OCC): AI가 KYC/AML/Compliance를 자동 처리하는 비율이 50% 넘어가면 감사 가이드라인 정비가 시급. SEC가 5월 안에 "AI-assisted compliance" 가이드 초안 공개 예정이라는 보도(Reuters).
투자자: Anthropic 가치 평가는 다음 라운드에서 점프 가능성. 동시에 OpenAI 가치 평가에는 압박 — "엔터프라이즈 금융은 Anthropic이 가져갈 가능성"이라는 베팅이 들어와. Microsoft 입장에서는 "OpenAI 단일 의존" 디스카운트 해소로 PER 리레이팅 가능.
한국 시장 시사점: 카카오뱅크·KB·신한·우리는 Anthropic Korea 데스크와의 PoC 결정이 향후 12개월의 가장 큰 베팅. 한국어 금융 데이터(KOSPI 공시, 신용 데이터)와 Claude Opus 4.7 통합은 토스·카카오뱅크 같은 핀테크의 백오피스 자동화 가속을 의미. NH투자·미래에셋도 IB 워크플로 자동화에서 도입 결정 임박이라는 게 업계 컨센서스.
참고 자료
- Introducing Claude Opus 4.7 — Anthropic, 2026-05-05
- Anthropic deepens push into Wall Street with new AI agents — Fortune, 2026-05-05
- Introducing Anthropic's Claude Opus 4.7 model in Amazon Bedrock — AWS, 2026-05-05
- Agents for financial services — Anthropic, 2026-05-05
- Anthropic-Blackstone-Goldman $1.5B PE JV — Reuters, 2026-05-04
- Vals AI Finance Agent benchmark — Vals AI, 2026-05
출처
관련 기사
AI 트렌드를 앞서가세요
매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.



