AI 3건 · 일반 2건
DeepMind가 Gemini Flash에 음성 입력→텍스트→응답 파이프라인을 단일 API 호출로 묶었다. 별도 STT 단계 없이 .wav 한 개를 그대로 던지면 된다. 지연시간이 평균 380ms로 떨어지면서 콜센터/회의 시나리오의 진입 장벽이 낮아졌다.
llm CLI 0.30이 나왔다. 핵심은 conversation 스코프의 SQLite 기록과 plugin 사이드로드 개선. 터미널 한 줄로 여러 모델을 비교하는 로컬 워크플로우를 가장 깔끔하게 푼 도구라는 평가가 굳어지고 있다. simonw 본인 글이 그대로 사용 매뉴얼이다.
OpenAI 출신 Lilian Weng의 새 글. 에이전트가 자기 작업을 사후 평가하는 self-critique 패턴 5가지를 비교했다. 'reflexion'류 외에 새로운 ADELE 패턴이 가장 안정적이라는 분석이 핵심. 직접 구현한 코드 스니펫이 함께 공개됐다.
vercel/ai 6.1은 streaming UI 메시지 partial update 안정화가 핵심. useChat이 React 19 transitions와 자연스럽게 합쳐지고, 메시지 단위 캐시 무효화 API가 추가됐다. Next 16 + React 19 조합 위에서 UX가 한 단계 매끄러워진다.
Gergely Orosz의 무료편이 풀렸다. 50명 이상 팀에서 모노레포가 실패하는 3가지 패턴: CI 시간 폭발, 역할 모호화, 도구 오너십 공백. 메모할 만한 인사이트는 'Bazel은 기술 문제가 아니라 사회 문제를 푸는 도구'.