전 GitHub CEO가 만든 Entire, 에이전트 시대의 Git을 재정의하다
Git은 뭐가 바뀌었는지는 기록하지만, 왜 그런 결정을 내렸는지는 모른다. Entire는 AI 에이전트의 의사결정 과정까지 추적하는 새로운 체크포인트 시스템이다.

에이전트가 만든 코드, 3개월 뒤에 "이거 왜 이렇게 만들었지?"라고 물으면 답할 수 있을까?
Git은 뭐가 바뀌었는지는 기록하지만, 왜 그런 결정을 내렸는지는 모른다. 전 GitHub CEO Nat Friedman이 공동 창업한 Entire가 이 문제를 정면으로 겨냥했다. Git의 commit 메시지는 자유 텍스트일 뿐, 구조화된 의사결정 기록이 아니다. 에이전트가 코드를 작성하는 비율이 높아질수록 이 한계가 치명적으로 다가온다.
창업자와 배경
Nat Friedman은 2018~2021년 GitHub CEO를 역임했다. 재임 중 GitHub Copilot 개발을 초기 단계에서 추진했고, Microsoft의 GitHub 인수($7.5B, 약 10조 원) 직후 CEO로 취임해 GitHub을 AI 중심 플랫폼으로 전환시킨 인물이다. 공동창업자 Daniel Gross는 Y Combinator의 전 파트너이자, Apple에서 Siri 이후 머신러닝 전략을 이끌었던 엔지니어다. 두 사람은 이전에도 AI Grant라는 AI 연구자 지원 프로그램을 함께 운영했으며, 이 프로그램에서 Character.AI와 Hugging Face의 초기 투자에 참여한 이력이 있다.
Friedman은 블로그 포스트에서 이렇게 말했다:
"Git은 2005년 Linux 커널 개발을 위해 만들어졌다. 사람이 코드를 쓰던 시대의 도구다. 지금은 코드의 절반 이상을 에이전트가 쓴다. 도구가 바뀌어야 할 때다."
핵심 기능 — Checkpoints
Entire Checkpoints는 기존 Git 위에 얹는 레이어(layer, 추가 계층)다. 코드 변경뿐 아니라 AI 에이전트의 의사결정 컨텍스트(context, 맥락 정보)—프롬프트(prompt, 모델에 보내는 지시문), 중간 추론, 대안 비교—까지 함께 저장한다. Entire 블로그에 따르면 checkpoint 하나당 평균 메타데이터 크기는 12~48KB로, 일반 Git commit 대비 저장 오버헤드(overhead, 추가 부담)가 크지 않다.
1. 컨텍스트 체크포인트
코드 diff와 의사결정 기록을 하나의 단위로 묶는다. 일반 Git commit이 "파일 A의 23번째 줄이 바뀌었다"를 기록한다면, Entire checkpoint는 "에이전트가 3가지 접근법을 비교한 뒤 성능과 유지보수성을 고려해 방법 B를 선택했다"까지 기록한다.
저장되는 메타데이터:
- 프롬프트 히스토리: 에이전트에 전달된 전체 프롬프트 체인
- 추론 트레이스(reasoning trace): 중간 사고 과정, 즉 chain-of-thought(단계별 추론 흐름)
- 대안 분석: 검토했으나 채택하지 않은 접근법과 그 이유
- 컨텍스트 윈도우(context window): 에이전트가 참조한 파일과 문서 목록
2. 에이전트 리플레이
특정 시점의 에이전트 사고 과정을 재현할 수 있다. 디버깅할 때 "이 코드가 왜 이렇게 생겼지?"라는 질문에 대해, 그 시점의 에이전트가 어떤 정보를 보고 어떤 추론을 거쳤는지 그대로 재생한다. 이는 기존의 git blame이 "누가 언제 바꿨는지"만 보여주는 것과 근본적으로 다르다. 리플레이에는 해당 시점의 모델 버전, 토큰 사용량, 응답 지연 시간(latency)까지 포함된다.
3. 브랜치 비교
에이전트가 고려한 대안들을 시각적으로 비교한다. 단순 코드 diff가 아니라, 각 대안의 장단점 분석까지 나란히 볼 수 있다.
4. 팀 협업 기능
여러 에이전트가 동시에 작업할 때, 각 에이전트의 결정이 어떻게 서로 영향을 미쳤는지 추적한다. 에이전트 A가 데이터베이스 스키마를 변경했을 때 에이전트 B가 그에 맞춰 API를 수정한 과정을 하나의 타임라인에서 볼 수 있다.
기술 아키텍처
Entire는 Git을 대체하지 않는다. 기존 .git 디렉토리 옆에 .entire 디렉토리를 생성하고, 양방향 동기화를 유지한다.
| 구분 | Git | Entire |
|---|---|---|
| 추적 대상 | 파일 변경 | 파일 변경 + 의사결정 컨텍스트 |
| 단위 | Commit | Checkpoint |
| 메타데이터 | 메시지, 작성자, 타임스탬프 | + 프롬프트, 추론, 대안, 참조 파일 |
| 호환성 | — | 기존 Git과 100% 호환 |
| 저장소 | 로컬 + 리모트 | 로컬 + 리모트 + 선택적 클라우드 |
CLI(Command Line Interface, 명령줄 도구) entire는 Git 명령어를 그대로 래핑(wrapping, 감싸서 확장)한다. entire commit은 내부적으로 git commit을 실행하면서 추가 메타데이터를 .entire/에 저장한다. 기존에 Git을 쓰던 팀이라면 명령어 앞에 entire만 붙이면 되므로, 학습 비용이 거의 없다. VS Code, JetBrains IDE용 확장도 베타로 제공되며, GitHub Actions와 연동되는 CI/CD 플러그인도 준비 중이다.
왜 지금 이게 중요한가
AI 코드 비율의 급증
GitHub의 2025 Octoverse 리포트에 따르면, GitHub Copilot을 사용하는 프로젝트에서 AI가 기여한 코드 비율이 평균 46%에 달했다. 2024년에는 35%였다. Cursor, Windsurf, Claude Code 같은 에이전트 코딩 도구의 부상으로 2026년에는 이 비율이 60%를 넘을 것으로 예상된다.
감사 가능성(Auditability, 추적 감사) 문제
규제 산업(금융, 의료, 국방)에서 AI가 작성한 코드는 "왜 이렇게 구현했는가"에 대한 근거를 제시해야 한다. 2024년 8월부터 단계적으로 시행 중인 EU AI Act는 고위험 AI 시스템에 대해 의사결정 추적 가능성을 명시적으로 요구하며, 위반 시 전 세계 매출의 최대 7%에 해당하는 과징금이 부과될 수 있다. 한국에서도 2026년 시행 예정인 AI 기본법이 유사한 투명성 조항을 포함하고 있다. 기존 Git commit 메시지는 "fixed bug"나 "refactored code" 수준의 간략한 기록에 그치기 때문에, 감사(audit) 시 규제 요건을 충족하기 어렵다.
다중 에이전트 협업
하나의 프로젝트에 여러 에이전트가 동시에 작업하는 시나리오가 일반화되고 있다. Devin, OpenHands, Claude Code가 각각 다른 모듈을 수정할 때, 이들의 결정이 충돌하거나 의존하는 관계를 파악하려면 커밋 메시지 이상의 정보가 필요하다.
경쟁 환경
Entire가 겨냥하는 "AI 에이전트용 개발 인프라" 시장에는 다른 플레이어도 있다:
- Cognition (Devin): AI 에이전트 자체에 집중. 에이전트가 코드를 쓰는 것이 핵심이고, 버전 관리는 기존 Git을 사용
- Replit Agent: 환경 셋업부터 배포까지 자동화하지만, 의사결정 추적 기능은 없음
- GitButler: Git의 UX를 개선하는 데 집중. AI 에이전트보다는 인간 개발자를 위한 도구
Entire는 이들과 경쟁하기보다 보완하는 위치다. 어떤 에이전트 도구를 쓰든, 그 에이전트의 결정을 추적하는 인프라를 제공한다. 이 포지셔닝은 AWS가 어떤 애플리케이션이든 호스팅하는 인프라 레이어가 된 것과 유사하다. Entire는 에이전트 코딩의 "관측 인프라(observability infrastructure)"를 노리고 있다.
투자 현황
Entire는 2026년 2월 시리즈 A에서 $85M을 유치했다. 리드 투자자는 Andreessen Horowitz(a16z)의 AI 인프라 펀드. a16z는 최근 AI DevTools 인프라에 대한 투자 테제를 공개하며, "에이전트가 코드를 쓰는 시대에 새로운 종류의 개발 도구가 필요하다"고 밝힌 바 있다.
관련 프로젝트와 배경 지식
버전 관리의 역사적 맥락
버전 관리는 대략 15~20년 주기로 패러다임이 바뀌었다:
- 1972: SCCS — 단일 파일 버전 관리
- 1986: CVS — 다중 파일, 중앙 서버
- 2000: SVN — CVS 개선, 원자적 커밋
- 2005: Git — 분산 버전 관리, Linus Torvalds가 Linux 커널을 위해 개발
- 2026: Entire — AI 에이전트의 의사결정까지 추적
각 전환점에는 "누가 코드를 쓰는가"의 변화가 있었다. Git은 오픈소스 커뮤니티의 분산 협업을 위해 만들어졌고, Entire는 인간-AI 협업을 위해 만들어지고 있다. 주목할 점은, 각 세대의 도구가 이전 세대를 완전히 대체한 것이 아니라 그 위에 계층을 얹었다는 것이다—SVN에서 Git으로 전환할 때도 svn2git 같은 마이그레이션 도구가 생태계 전환을 도왔다. Entire도 Git 위에 동작하므로, 기존 워크플로우를 유지하면서 AI 추적 능력을 더하는 접근이다.
DVC와 MLflow — 기존 AI 버전 관리
머신러닝 분야에서는 이미 유사한 도구가 있었다:
- DVC (Data Version Control): 데이터셋과 모델의 버전 관리. Git과 함께 사용
- MLflow: ML 실험 추적, 모델 레지스트리
- Weights & Biases: 실험 로깅, 시각화, 하이퍼파라미터 추적
이들은 모델 학습 과정을 추적한다. Entire는 코드 생성 과정을 추적한다. 문제가 다르지만, "AI의 결정을 추적한다"는 공통점이 있다.
AI Observability 시장
Entire가 속하는 넓은 카테고리는 "AI Observability(AI 관측 가능성)"다. Datadog, New Relic 같은 기존 APM(Application Performance Monitoring, 애플리케이션 성능 모니터링) 도구가 AI 특화 기능을 추가하고 있고, LangSmith(LangChain의 디버깅/모니터링 도구), Arize AI, Helicone 같은 스타트업도 이 시장을 노리고 있다. Gartner는 AI Observability 시장이 2028년까지 $9.5B(약 12조 원)에 달할 것으로 예측한다. Entire의 독특한 포지셔닝은 개발 시점의 의사결정 추적에 초점을 맞춘다는 것이다. 다른 도구들이 배포 이후의 프로덕션 모니터링에 집중하는 것과 차별화된다.
시사점
Entire의 접근은 단순한 버전 관리 도구 그 이상이다. 에이전트가 코드를 작성하는 시대에, 인간 개발자가 AI의 결정을 이해하고 검증할 수 있는 기반을 만들고 있다.
개발자에게 주는 메시지는 명확하다: 앞으로는 "무엇이 바뀌었는가"보다 "왜 그렇게 바뀌었는가"가 더 중요해진다. Git이 코드 협업의 기반이었다면, Entire는 인간-AI 협업의 기반이 되려 한다. 다만 Entire의 성공 여부는 결국 개발자 생태계의 채택에 달려 있다. Git도 초기에는 SVN 대비 학습 곡선 때문에 저항을 받았지만, GitHub이라는 킬러 플랫폼이 생태계를 만들어냈다. Entire에게도 비슷한 플랫폼 효과가 필요할 것이다.
현재 Private Beta(비공개 시범 운영) 단계이며, 대기자 명단에 등록할 수 있다. GA(General Availability, 정식 출시)는 2026년 Q3 예정이다.
관련 기사

OpenClaw — 클라우드 없이 돌아가는 개인 AI 비서가 25만 스타를 찍은 이유
로컬에서 돌아가고, WhatsApp·Telegram·Slack·iMessage까지 50개 플랫폼을 연결하는 개인 AI 에이전트. 주말 프로젝트가 깃허브 역사상 가장 빠른 성장을 기록했다.

Deeptune, a16z 주도로 $43M 시리즈A — AI 에이전트의 '훈련 체육관'을 짓는다
Deeptune이 a16z 주도로 $43M 시리즈A를 유치했다. AI 에이전트가 실제 업무 소프트웨어를 시뮬레이션하며 강화학습으로 훈련하는 플랫폼. 기술, 팀, 시장 총정리.

GPT-5.4 완전 해부 — 컴퓨터를 직접 조작하는 첫 번째 범용 모델의 모든 것
OpenAI가 GPT-5.4를 공개했다. 100만 토큰 컨텍스트, Computer Use 네이티브 탑재, OSWorld 75% 달성. 스펙, 벤치마크, 경쟁 구도까지 총정리.
AI 트렌드를 앞서가세요
매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.
