AI 3건 · 일반 2건
Cohere가 Command R+ v2를 공개했다. RAG 특화 모델로 검색→재정렬→생성 파이프라인 전체를 한 모델 안에서 처리한다. 가격이 R+ v1 대비 35% 인하, 평가에서 GPT-5.4와 검색 지연 추론 단계만 비교하면 거의 동급이다.
arxiv cs.CL 신착이 NIAH 류 needle-in-haystack 평가의 한계를 정리하고 후속 표준을 제안한다. 'multi-needle reasoning' 메트릭 도입, 1M 컨텍스트에서 모델 간 차이를 더 명확히 본다. 평가 코드 공개됨.
Nathan Lambert의 새 글이 DPO와 PPO 비교 논쟁을 정리했다. 결론은 '데이터 품질이 알고리즘 선택보다 5배 중요', 다만 high-stakes safety tuning에는 PPO가 여전히 안전 마진 우위. 표 한 장 요약이 매우 깔끔하다.
ggerganov/llama.cpp가 v0.5로 점프했다. GGUF v3 포맷이 도입되며 KV-cache 양자화 옵션이 정식 노출됐다. M3/M4 Max에서 70B 모델 추론 속도가 22% 향상됐다는 벤치도 함께 발표됐다.
continuedev/continue가 v0.10을 냈다. 핵심은 워크스페이스 단위 임베딩 인덱스가 IDE 확장 안에서 자동으로 갱신된다는 점. Cursor의 codebase 검색에 가까운 경험을 오픈소스로 무료로 제공한다.