spoonai
데일리 브리핑

4월 09일 데일리 브리핑

GLM-5.1이 SWE-Bench Pro 1위를 찍으며 오픈소스 역사를 썼고, Google이 스마트폰용 LLM 엔진 LiteRT-LM을 공개했고, OpenAI가 아동 안전 청사진과 외부 안전 펠로우십을 동시에 발표했다.

TOP STORIES

01. GLM-5.1이 SWE-Bench Pro 1위를 찍었다

중국 Z.ai(구 Zhipu AI)의 GLM-5.1이 SWE-Bench Pro에서 58.4점으로 역대 최고를 기록했어. Claude Opus 4.6(57.3)과 GPT-5.4(57.7)을 모두 넘어섰는데, 이 모델은 MIT 라이선스 오픈소스야. 744B 파라미터 MoE 아키텍처에 40B 활성 파라미터, 200K 컨텍스트 윈도우. 하나의 코딩 작업을 최대 8시간 자율 수행하는 에이전틱 엔지니어링이 핵심 기능이야.

전문 읽기 →

02. Google LiteRT-LM – 스마트폰에서 LLM 돌리는 시대

Google이 LiteRT-LM을 오픈소스로 공개했어. Android, iOS, 웹, 데스크탑, 라즈베리 파이까지 지원하는 엣지 디바이스 LLM 추론 엔진이야. Chrome의 Gemini Nano, Pixel Watch에 이미 실전 투입 중이었고, 이번에 개발자 전체에 공개된 거야. Gemma 4 E2B(2.3B)를 스마트폰에서 직접 구동할 수 있어.

전문 읽기 →

03. OpenAI, 아동 안전 청사진 + 안전 연구 펠로우십 발표

OpenAI가 4월 8일 하루에 세 가지를 발표했어. 아동 안전 청사진(AI 생성 착취물 대응 프레임워크), 외부 안전 연구 펠로우십(2026년 9월–2027년 2월, 지원금+컴퓨팅 제공), 엔터프라이즈 AI 다음 단계. 2025년 안전팀 이탈 이후 가장 적극적인 안전 행보야.

전문 읽기 →

04. NVIDIA 로봇 주간 – Physical AI가 현실이 됐다

National Robotics Week에서 NVIDIA가 Physical AI 성과를 공개했어. Maximo가 자율 로봇으로 100MW 태양광 발전소를 완공했고, Aigen은 태양광 구동 잡초 제거 로봇을 실전 배치 중이야. 둘 다 NVIDIA Omniverse + Isaac Sim으로 개발. 시뮬레이션에서 현실로 넘어가는 sim-to-real이 상용 수준에 도달한 거야.

전문 읽기 →


COMMUNITY BUZZ

RTX 5090 vs DGX Spark vs AMD AI395 – llama.cpp 벤치마크 대결

r/LocalLLaMA에서 55 upvotes, 81 comments를 기록한 하드웨어 비교 테스트. 같은 모델, 같은 파라미터로 RTX 5090, DGX Spark, AMD AI395, R9700 듀얼 설정을 비교했어. 벤더 슬라이드가 숨기는 실전 추론 트레이드오프를 적나라하게 보여줘.

24GB GPU 하나로 멀티모달 생성

r/LocalLLaMA 핫 토론. "어떻게 temporal latents를 정렬하면서 denoising 시간을 두 배로 늘리지 않을 수 있을까?" 아직 깔끔한 답은 없지만, 2026년 4월 기준 일반 하드웨어에서 실제로 작동하는 방법들을 정리한 글이 주목받고 있어.

GLM-5.1 오픈소스가 폐쇄형을 이겼다 – X 반응

X(Twitter)에서 GLM-5.1의 SWE-Bench Pro 1위 소식에 바이럴 스레드가 여러 개 올라왔어. "오픈소스가 코딩에서 정상을 찍은 건 처음"이라는 반응과 "벤치마크 하나로 전체를 판단할 수 없다"는 신중론이 공존하고 있어.


TODAY'S PAPER

Does Unification Come at a Cost? Uni-SafeBench

통합 멀티모달 대형 모델(텍스트+이미지+오디오를 하나로 처리하는 모델)의 안전성을 측정하는 새 벤치마크야. 쉽게 말하면, 모델이 여러 모달리티를 동시에 처리할 수 있게 되면서 새로운 종류의 안전 취약점이 생기는데, 이걸 체계적으로 측정하는 도구가 나온 거야. 멀티모달 통합이 편의성만 주는 게 아니라 안전 비용도 수반한다는 걸 보여주는 연구.


QUICK HITS

  • Broadcom, Google/Anthropic과 TPU 칩 확대 계약 – Anthropic에 3.5GW 컴퓨팅 제공, 연간 매출 런레이트 $300억 돌파
  • Q1 2026 글로벌 VC 투자 $3,000억 – 역대 최고. AI가 견인
  • Google Gemma 4, Apache 2.0으로 공개 – E2B/E4B/26B MoE/31B Dense 4개 사이즈
  • Microsoft MAI 모델 3종 발표 – Transcribe-1, Voice-1, Image-2. Azure Foundry에서 사용 가능
  • Meta, 차세대 AI 모델 오픈소스 공개 예고 – Axios 단독 보도
  • 한국 스타트업 투자 8,565억원 (3/30–4/3) – AI 반도체, 바이오 집중
  • Eclipse Ventures $13억 펀드 – Cerebras 투자사, 로봇+AI 인프라에 집중
  • 모빌린트, 포스코DX와 NPU 기반 AI 인프라 협력
  • OpenAI ChatGPT Business 가격 인하 + Codex 전용 시트 추가
  • Google Veo 3.1 Fast 가격 인하 – 비디오 AI 비용 장벽 낮춤
  • Utah, 미국 최초로 AI 처방전 갱신 허용 – 헬스케어 AI 확대
  • AI 에너지 효율 100배 향상 연구 – 뉴로-심볼릭 접근법
  • K-Global 2026 해외진출 지원사업 – AI 디지털 혁신 초기 스타트업 대상
  • 정부, AI 예산 약 8천억원 투입 – 청년 AI 인력 양성 전국 확산
  • Shield AI $15억 밸류에이션 – 국방 자율 드론

GITHUB TRENDING

abhigyanpatwari/GitNexus

브라우저에서 돌아가는 코드 지식 그래프 + Graph RAG 에이전트. GitHub 레포나 ZIP 파일을 넣으면 인터랙티브 지식 그래프를 생성해줘. Tree-sitter로 AST 파싱, KuzuDB로 그래프 DB 구축. 서버 없이 100% 클라이언트 사이드. 25.1k stars.

virattt/ai-hedge-fund

6개 AI 에이전트(마켓 데이터, 퀀트, 펀더멘탈, 센티먼트, 리스크, 포트폴리오)가 협업하는 헤지펀드 시뮬레이션. 5년 전에는 50인 퀀트 팀이 필요했을 일을 오픈소스로 구현. 50.5k stars.

google-ai-edge/LiteRT-LM

Google의 엣지 디바이스 LLM 추론 프레임워크. Android/iOS/Web/Desktop/IoT 크로스 플랫폼. Gemma 4 풀 지원. GPU+NPU 가속. 함수 호출, 멀티모달 지원. Chrome과 Pixel Watch에 이미 실전 투입 중. 빠르게 성장 중.

무료 뉴스레터

AI 트렌드를 앞서가세요

매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.