AI 5건 · 일반 3건
Mistral이 Large 3을 공개했다. 200B 규모, 50개 언어 지원이 핵심이고 한국어/일본어 특히 개선됐다. 가격은 GPT-5.4와 비슷, 다만 EU 데이터 거주 옵션이 큰 차별점. EU 고객 대상 SaaS에는 즉시 검토할 만한 카드.
Karpathy의 새 4시간 강의가 올라왔다. 이번엔 LLM 평가, 특히 vibes-based eval과 numeric eval의 경계를 정량적으로 풀어낸다. 기존 nn-zero-to-hero 시리즈와 같은 톤이라 재미보다는 깊이를 기대하면 좋다.
Sebastian Raschka의 'From Scratch LLM' 11장 출간. RoPE 변형과 컨텍스트 윈도우 확장 트릭(YaRN, ALiBi)을 NumPy로 처음부터 구현한다. 책 전체가 Llama 3급 구조를 짧은 코드로 따라 만드는 식이라 학습 가치가 매우 높다.
Dwarkesh Patel의 새 에피소드는 Demis Hassabis 인터뷰. 2시간 분량으로 AlphaProof, Veo 후속, 그리고 DeepMind가 보는 '다음 4년의 AGI 정의'에 집중한다. 인터뷰 톤이 다른 어떤 매체보다 직설적이다.
The Gradient의 분기 리포트가 GPU 공급 곡선을 다시 그렸다. H100 단가 하락은 상수, B200/H200 가용성이 결정적. 인하우스 추론 vs 외부 API 균형선이 6개월 안에 다시 한 번 흔들릴 가능성을 정량적으로 보여준다.
huggingface/transformers 5.0이 메이저 버전으로 떨어졌다. 핵심 API는 호환 유지지만 train loop가 Accelerate 5와 깊이 통합돼 멀티 노드 학습이 한결 깔끔해졌다. 일부 deprecated 인자가 제거돼 마이그레이션 노트 한 번 훑을 가치가 있다.
카카오 기술블로그가 Solar 후속 한국어 모델 도입기를 공개했다. 자체 RAG 게이트웨이 안에서 영어 모델과 어떻게 라우팅하는지, 한국어 톤 평가 룰브릭은 어떻게 구성했는지를 구체적으로 푼다. 한국어 LLM 운영 관련 글 중 올해 가장 실용적.
우아한형제들 기술블로그의 Spring AI 도입 회고. 자바 백엔드에서 LLM을 호출하는 추상화를 어떻게 잡았고, retry/timeout 정책을 어디에 두었는지 단계별로 보여준다. JVM 진영에서 LLM 도입을 시작하는 팀에 거의 그대로 복사 가능한 레퍼런스.