AI 5건 · 일반 3건
HuggingFace 블로그 메인 글이 서버리스 파인튜닝 가이드. 데이터셋 업로드부터 LoRA 저장, 배포까지 5분 안에 마무리되는 워크플로우를 풀어준다. 가격 페이지가 같이 공개돼 진입 장벽이 한 번 더 낮아졌다.
Reka가 1B 멀티모달 모델 Reka Flash를 공개했다. 이미지/비디오/오디오 입력을 모두 받으면서 모바일 디바이스에서 동작 가능한 첫 멀티모달 SOTA. 평가 점수는 GPT-5.4-mini 멀티모달과 비교할 만한 수준이라는 게 화제.
Together AI가 Inference v3을 공개했다. 자체 라우팅으로 같은 모델을 더 싼 호스트로 자동 전환, 평균 32% 비용 절감. 오픈웨이트 모델을 SaaS에서 굴리는 팀에는 즉시 영향이 있다. 마이그레이션 비용 거의 0.
Eugene Yan의 새 글이 추천 시스템에 LLM을 끼워 넣는 5가지 패턴을 정리했다. retrieval-rerank-generate 외에 user understanding 단계에서만 LLM을 쓰는 hybrid 패턴이 가장 비용 효율적이라는 결론. 실무 회사 사례 인용이 풍부하다.
a16z가 분기 보고서로 'AI native enterprise'를 정의했다. 단순 도입 단계를 넘어 워크플로우 자체가 LLM 가정 위에 설계된 회사들의 패턴 분석. 가장 흥미로운 건 'AI hire' 카테고리 — 사람보다 에이전트를 먼저 고용 결정하는 사례 8곳을 인터뷰했다.
claude-code 2.4.1 핫픽스가 떨어졌다. 어제 v2.4의 백그라운드 태스크 누수 이슈 수정과 hook 디버그 패널 minor 개선. 별도 마이그레이션 없이 즉시 업데이트 권장.
HN 1면. 6년 운영한 200만 LOC 모노레포에서 어떤 결정이 나중에 비싸졌는지 정리한 회고. 핵심은 'CI 캐시 설계는 1년차에 하라' 와 'codeowners 자동화 없으면 5년차에 무너진다'. 큰 코드베이스 만지는 팀이라면 그대로 체크리스트.
Pragmatic Engineer 무료편이 'staff+ 엔지니어 인터뷰 패턴 2026'을 풀었다. 시니어 + 스태프 단계에서 시스템 디자인보다 trade-off 협상 능력을 더 본다는 데이터, 회사 6곳 사례 인용. 시니어 이직 준비 중이라면 직접 영향.