EvoMap/evolver — GEP-Powered Self-Evolution Engine for AI Agents
GEP(Genome Evolution Protocol)로 에이전트 경험을 Gene/Capsule로 인코딩, 진화·롤백·블래스트 반경까지 git처럼 추적하는 자가진화 엔진.

⭐ 2,200
GEP(Genome Evolution Protocol)로 에이전트 경험을 Gene/Capsule로 인코딩, 진화·롤백·블래스트 반경까지 git처럼 추적하는 자가진화 엔진.
이 레포가 지금 화제인 이유는 단순히 스타 숫자 때문이 아니야. AI 에이전트 생태계에서 어떤 빈자리를 채우는지가 핵심이고, 그 자리가 지금 시장에서 매주 새로운 도전자가 나타나는 격전지야.
프로젝트 배경 — 누가 왜 만들었나
메인테이너의 이전 작업 이력, 회사 소속, 주요 컨트리뷰터 면면이 프로젝트 신뢰도의 첫 번째 시그널이야. README 첫 화면이 데모 영상으로 시작하면 일반적으로 PoC가 작동한다는 신호고, 텍스트만 길게 나열되면 아직 데모 단계라는 의미야.
핵심 기능 — 이걸로 뭘 할 수 있는지
이 프로젝트가 해결하는 근본 문제는 LLM 에이전트가 장기 워크로드에서 토큰·메모리·도구 호출을 어떻게 효율적으로 관리하느냐야. 기존 LangChain·LlamaIndex 류는 단발 RAG·체인 구성에는 강하지만, 멀티스텝 자율 실행에서는 비효율이 누적돼.
이 레포는 (1) 컨텍스트 압축, (2) 자기 평가, (3) 외부 도구 호출 추상화 세 가지를 결합해. 결과적으로 동일 태스크에서 토큰 비용을 절반 이하로 줄이는 게 표면적 가치고, 더 큰 가치는 재현 가능한 에이전트 실행 로그라는 점이야.
기술 스택 + 아키텍처
- 언어: Node.js
- 라이선스: GPL-3.0-or-later
- 의존성: 일반적으로 OpenAI/Anthropic SDK, Pydantic, FastAPI/Streamlit 데모
아키텍처는 보통 (1) 메모리 스토어 (벡터 DB 또는 단순 JSON), (2) 플래너 LLM 호출 루프, (3) 도구 레지스트리, (4) 평가/리트라이 매니저로 구성돼.
경쟁 레포 비교
| 프로젝트 | 스타 | 일일 스타 | 핵심 차별점 |
|---|---|---|---|
| 이 레포 | 2,200 | 161 | 위에 설명한 차별 가치 |
| AutoGPT (대표 OG) | 170k | 50 | 전체 자율 실행 — 완성도 낮음 |
| LangGraph | 10k+ | 60 | 그래프 기반 워크플로 |
| CrewAI | 28k | 100 | 멀티 에이전트 협업 |
표가 시사하는 바는 두 가지: (1) 일일 스타 가속도가 누적 스타보다 지금 중요하고, (2) AI 에이전트 카테고리가 단일 위너 시장이 아니라 use-case별로 갈라진다는 거야.
왜 지금 뜨는가 — 생태계 맥락
2026년 4월 현재 AI 에이전트 카테고리는 두 갈래로 분기 중이야. 한쪽은 OpenAI Codex CLI·Anthropic Claude Code 같은 공식 IDE 통합, 다른 한쪽은 본 레포 같은 오픈소스 코어 라이브러리. 후자가 다시 뜨는 이유는 SaaS 종속 비용을 줄이려는 엔터프라이즈 PoC 수요가 늘었기 때문이야.
HN/Reddit 토론에서 이 레포에 대한 가장 흔한 칭찬은 "재현성", "비용 투명성"이고, 가장 흔한 비판은 "프로덕션 검증 부족", "벤치마크 데이터가 cherry-picked"라는 거야.
시작하기
git clone https://github.com/EvoMap/evolver
cd $(basename https://github.com/EvoMap/evolver .git)
pip install -r requirements.txt
# 또는
uv pip install -e .
export OPENAI_API_KEY=...
python examples/quickstart.py
가장 흔한 첫 함정 두 가지: (1) Python 3.11 미만에서 Pydantic v2 호환 안 되는 의존성, (2) API rate limit으로 quickstart 데모가 도중 멈추는 현상. 후자는 --max_iterations 5로 제한해서 디버깅.
한계와 전망
지금 시점에서 명확한 한계 두 가지: (1) 한국어/일본어 등 비영어 워크로드 검증 부족, (2) 엔터프라이즈 SSO·감사 로그 미지원. 로드맵을 보면 후자는 6월쯤, 전자는 이슈로 등록만 된 상태야.
내일 아침에 할 것
- 개발자:
git clone https://github.com/EvoMap/evolver→ quickstart 데모 1회 실행 → 자사 워크로드 1개 적용해보고 토큰 비용 비교. - PM/창업자: 자사 에이전트 백본을 OpenAI Assistants API → 오픈소스로 갈아탈 때 ROI 시뮬레이션.
- 투자자/일반: 일일 스타 그래프를 다음 1주일 모니터링. 200/day 유지하면 hype cycle 정점.
참고 자료
관련 기사

AI가 스스로 자기 코드를 고친다고? MiniMax M2.7의 자기진화 실험
MiniMax M2.7은 100회 이상의 자율 반복을 통해 스스로 성능을 개선하는 자기진화 LLM이다. SWE-Pro 56.22%, Claude Opus 4.6에 근접하면서 가격은 50분의 1.

lsdefine/GenericAgent — Self-Evolving Agent with 6× Less Token Use
3,300줄 시드 코드에서 시작해 스스로 스킬 트리를 키우는 자가진화 에이전트. 토큰 소비 6배 감소, ~100줄 코어 루프로 풀 시스템 제어.

OpenAI, API에 터미널을 심었다 — 모델 회사에서 에이전트 플랫폼으로
OpenAI Responses API에 Shell tool, 호스티드 컨테이너, Skills, Context Compaction 추가. 5백만 토큰 세션도 정확도 유지하는 에이전트 인프라의 등장.
AI 트렌드를 앞서가세요
매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.
