AI 3건 · 일반 2건
Anthropic이 Claude에 한 줄 답변 모드를 정식으로 추가했다. system 프롬프트에 `verbosity: terse` 같은 시그널을 줄 필요 없이 API 파라미터 하나로 제어된다. 가장 큰 변화는 토큰 출력이 평균 60% 줄면서 캐시 적중률이 따라 오른다는 점. 챗봇 UI보다 에이전트 워크플로우에 더 큰 영향이 예상된다.
HuggingFace Papers 1위는 에이전트가 실패하는 8가지 모드를 코드 트레이스 단위로 분류한 페이퍼. '도구 환각', '계획 망각', '루프 진입' 같은 명명이 후속 디버깅 도구의 표준 어휘가 될 가능성이 있다. 평가 룰브릭이 부록 A로 함께 공개돼 자체 에이전트에 그대로 옮겨 쓸 수 있다.
OpenAI가 GPT-5.5에 reasoning_effort 파라미터를 정식 노출했다. low / medium / high 세 단계로, high는 답까지 평균 12초 걸리지만 GPQA 점수가 크게 뛴다. 비싼 모델을 통째로 부르지 않고 같은 계열 안에서 비용/품질을 자유롭게 슬라이드할 수 있게 됐다.
anthropics/claude-code 2.5가 나왔다. 핵심은 hook 디버그 패널과 tool 실행 단위 캐싱. 슬래시 커맨드 인자 파싱이 다시 한번 까다로워져 기존 커스텀 명령어는 빠른 점검이 필요하다. SDK 쪽 breaking change는 없지만 settings 스키마에 신규 필드가 추가됐다.
리눅스 커널 6.20에서 발견된 메모리 매핑 회귀 버그를 14시간 안에 패치한 회고가 HN 1면에 올랐다. 테스트 실패 알림 → bisect 도구로 commit 좁히기 → 패치까지의 흐름이 자세히 적혀있다. 큰 코드베이스 디버깅 작업 흐름의 모범 사례로 읽을 만하다.