AI 3건 · 일반 2건
Meta가 Llama 4.1 시리즈를 공개했다. 8B는 Llama 3.3 70B와 거의 동급, 70B는 GPT-5.4 mini를 일부 벤치에서 추월. 400B는 단일 GPU 추론은 어렵지만 라이선스가 더 느슨해졌다. 개인 GPU 환경 vs API 호출 균형선이 다시 흔들린다.
arxiv cs.AI 신착 페이퍼가 복합 추론 벤치마크 CompoundQA에서 새 SOTA를 보고했다. 핵심은 verifier-prover 분리 구조로, 같은 모델 안에서 두 역할을 다른 시스템 프롬프트로 굴리는 단순한 트릭이 큰 폭의 개선을 냈다. 코드 공개됨.
Latent Space 팟캐스트에 Cursor CEO Michael Truell이 나왔다. tab autocomplete를 넘어 'composer'로 가는 내부 빌드 결정사, 모델 라우팅 전략, 모노레포 인덱싱 한계 등 운영 디테일이 풍부하다. 내 코드 에이전트 만들 때 직접 참고할 만한 디자인 결정들이 많다.
ollama v0.7이 나왔다. 헤드라인은 모델 sharded loading으로 큰 모델을 RAM 부족한 로컬에서도 부분 로드해서 굴릴 수 있게 됐다. 70B를 32GB MacBook에서 swap 없이 동작시킨 데모가 인상적. CPU 추론 성능도 9% 개선됐다.
Lobsters 톱은 PostgreSQL 18 알파 발표. pgvector 통합이 표준 익스텐션으로 옮겨가고, JSON path 처리가 빨라졌다. 베타까지 두 달 정도 남았는데 vector + jsonb 워크로드를 의존하는 팀에선 미리 호환성 점검할 가치가 있다.