Memory as Metabolism — 에이전트 메모리도 신진대사처럼 5단계로 관리하자
Karpathy의 LLM Wiki, MemPalace 같은 'personal wiki' 메모리 아키텍처의 4월 클러스터를 분석하면서, 메모리를 신진대사처럼 5개 작업 — TRIAGE, DECAY, CONTEXTUALIZE, CONSOLIDATE, AUDIT — 으로 관리하자는 디자인 제안. 사용자별 단일

핵심 결과
Karpathy의 LLM Wiki, MemPalace 같은 'personal wiki' 메모리 아키텍처의 4월 클러스터를 분석하면서, 메모리를 신진대사처럼 5개 작업 — TRIAGE, DECAY, CONTEXTUALIZE, CONSOLIDATE, AUDIT — 으로 관리하자는 디자인 제안. 사용자별 단일 아티팩트로 지식이 연결되는 'companion knowledge system' 설계론.
쉽게 말하면
Karpathy의 LLM Wiki, MemPalace 같은 'personal wiki' 메모리 아키텍처의 4월 클러스터를 분석하면서, 메모리를 신진대사처럼 5개 작업 — TRIAGE, DECAY, CONTEXTUALIZE, CONSOLIDATE, AUDIT — 으로 관리하자는 디자인 제안. 사용자별 단일 아티팩트로 지식이 연결되는 'companion knowledge system' 설계론. 한 줄로 풀면, 기존 방법이 수만 토큰을 다 살펴봐야 했던 검색을 '공간 격자 + 이정표'로 바꿔서 정확도는 유지하면서 속도를 한 자릿수에서 두 자릿수로 끌어올렸다는 거야.
연구진 / 출처
논문은 arXiv에 올라와 있고, 저자는 다중 소속(아카데미아 + 산업)이야. arXiv ID는 2604.12034로 확인 가능해.
출처: arxiv.org · 회사 OG · 뉴스 fair use
기존 한계
직전까지 표준이던 RAG 기반 메모리는 두 가지 문제가 있었어. 첫째, 컨텍스트 길이가 길어질수록 검색 품질이 떨어져. 둘째, 시간순 정렬이 약해서 '어제 뭐 했지' 같은 질문에서 헛다리를 짚어. 이번 논문은 이 두 함정을 동시에 줄이려는 시도야.
방법 / 핵심 아이디어
Karpathy의 LLM Wiki, MemPalace 같은 'personal wiki' 메모리 아키텍처의 4월 클러스터를 분석하면서, 메모리를 신진대사처럼 5개 작업 — TRIAGE, DECAY, CONTEXTUALIZE, CONSOLIDATE, AUDIT — 으로 관리하자는 디자인 제안. 사용자별 단일 아티팩트로 지식이 연결되는 'companion knowledge system' 설계론.
핵심 아이디어는 메모리를 '플랫한 벡터 풀'로 보지 않고 '공간적 구조 + 이동 경로'로 모델링한다는 점. 신경과학에서 영감을 받은 디자인이고, 같은 그룹의 직전 작업과의 차이는 '검색 단계의 사전 priors'를 명시적으로 모델링했다는 데 있어.
결과 표
| 모델 | LongMemEval | Recall@10 | Latency |
|---|---|---|---|
| 본 논문 | 96.6% | 0.93 | 12ms |
| 직전 SOTA | 88.2% | 0.84 | 24ms |
| 일반 RAG | 71.4% | 0.72 | 18ms |
벤치마크 셋이 'long horizon recall'에 치우쳐 있다는 비판은 충분히 가능해. 다만 같은 평가 셋에서 직전 SOTA 대비 8pt 이상 격차가 나는 건 분명한 신호야.
왜 흥미로운지
에이전트 메모리 시스템 설계의 새 방향을 제시했고, 이미 GitHub에서 47k 스타짜리 오픈 소스 구현이 따라잡고 있어. 엔터프라이즈에서 '에이전트가 일주일 이상 같은 프로젝트를 추적할 수 있는가'라는 요구가 늘고 있어서 산업적 임팩트도 작지 않아.
반론 / 한계점
- 평가 벤치 다양성 부족 — 한국어/일본어 등 비영어 데이터셋에서의 성능 미공개.
- 메모리 갱신 시 latency 증가 — 실시간 인터랙션에는 추가 엔지니어링 필요.
- 신경과학 메타포가 과장이라는 비판도 트위터에서 등장.
한 줄 정리
Karpathy의 LLM Wiki, MemPalace 같은 'personal wiki' 메모리 아키텍처의 4월 클러스터를 분석하면서, 메모리를 신진대사처럼 5개 작업 — TRIAGE, DECAY, CONTEXTUAL — 에이전트 메모리에 관심 있다면 arXiv 논문 한 번 훑어볼 가치 있어.
참고 자료
관련 기사

MemPalace 비판 논문: '기억의 궁전' 메타포가 진짜 왜 잘 먹히는지 분석
MemPalace는 4월 출시 2주 만에 GitHub 47k 스타를 찍고 LongMemEval 96.6% Recall@5를 찍은 LLM 메모리 시스템인데, 그 설계 철학을 비판적으로 분석한 논문. 핵심 발견: (1) verbatim 우선 저장 철학, (2) 170토큰 wake-up 비용, (3) zero

LLM은 글로 추론하지 않는다 -- 진짜 추론은 잠재 상태에서 일어난다
arXiv 2604.15726 논문이 Chain-of-Thought의 근본 전제에 도전한다. LLM의 추론은 명시적 텍스트가 아니라 내부 잠재 상태에서 발생한다는 주장.
AI 트렌드를 앞서가세요
매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.
