AI 3건 · 일반 2건
에이전틱은 새로운 앱을 개발하는 데 사용되고 있다. 그러나 이러한 앱을 실제로 사용하는 사람은 거의 없다. 새로운 앱을 개발하는 데 에이전틱의 잠재력을 최대한 활용하려면 사용자에게 더 매력적인 앱을 개발해야 한다. 에이전틱은 개발자에게 새로운 기회를 제공한다. 에이전틱으로 개발된 앱은 사용자에게 다양한 기능을 제공할 수 있다. 그러나 이러한 기능을 사용자에게 효과적으로 전달하는 데 성공하지 못한다면 에이전틱의 잠재력은 제대로 발휘되지 않는다.
Persona Atlas는 공개 인물의 사고방식을 측정 가능한 행동 포트레이트로 변환한다. 작은 LLM 에이전트가 웹에서 인물을 조사하여 도시에를 작성하고, 그 인물의 목소리로 개방형 질문에 답변한다. 각 답변은 임베딩되어 페르소나를 공간상의 지점으로 나타낸다. 이를 통해 여러 사상가의 사고방식(회의론, 유머, 추상성 등)을 시각적으로 비교하고 측정할 수 있다. 인물의 개성이 모델의 처리 능력보다 더 중요하게 발휘될 수 있음을 보여준다.
Domino는 Speculative Decoding의 새로운 방법론을 제시한다. 이 기법은 인과 모델링과 오토회귀 드래프팅을 분리하여 LLM 추론 속도를 대폭 높인다. 특히 Qwen3 모델에서 최대 5.8배의 처리량 개선을 시연한다. 이는 LLM 서비스의 비용 절감과 응답 시간 단축에 크게 기여할 전망이다.
느린 터미널은 개발자에게 매일 수백 번의 미세한 지연을 유발하여 전체 생산성을 저해한다. 이 글은 느린 터미널이 가져오는 반복적인 비효율성을 지적하며 개발 환경 최적화의 중요성을 강조한다. 저자는 oh-my-zsh와 같은 무거운 프레임워크를 배제하고, 최소한의 플러그인 및 .zshrc 내 compinit 캐싱 설정을 통해 30ms 이내의 빠른 셸 시작 속도를 달성한다. 이는 불필요한 리소스 소모를 막고 끊김 없는 작업 흐름을 유지한다.
Google이 SpaceX와 월 9.2억 달러 규모의 컴퓨팅 자원 공급 계약을 체결한다. Google은 2026년 10월부터 2029년 6월까지 NVIDIA GPU, CPU 등 약 11만 대의 하드웨어에 접근한다. 이는 Anthropic과의 유사 계약에 이어, AI 서비스 수요 급증에 대응하기 위한 Google의 전략적 컴퓨팅 확보 움직임이다.