AI 6건 · 일반 2건
vLLM 프로젝트는 v0.20.2 버전을 출시했습니다. 이 버전은 6개의 커밋과 6명의 기여자가 참여한 작은 패치 릴리즈로, DeepSeek V4, gpt-oss, Qwen3-VL의 버그를 수정했습니다. 이러한 버그 수정은 프로젝트의 안정성과 성능을 향상시키는 데 중요한 역할을 합니다. 특히, DeepSeek V4의 sparse attention과 KV cache 관련 버그가 해결되었습니다.
관계형 모델링과 APL은 데이터를 다루는 새로운 방식을 제시합니다. APL은 배열 언어로, 데이터를 다차원 배열로 표현하여 효율적인 연산을 수행할 수 있습니다. 관계형 모델링은 데이터를 테이블 형태로 표현하여 데이터 간의 관계를 명확하게 정의할 수 있습니다. 두 가지 접근 방식은 데이터를 다루는 새로운 방법을 제공하여, 개발자들이 더 효율적이고 효과적으로 데이터를 처리할 수 있습니다. 이 접근 방식은 데이터 과학, 인공지능, 머신러닝 등 다양한 분야에서 활용될 수 있습니다.
Apple Intelligence 업데이트로 iOS 18부터 Siri 대신 Claude 또는 Gemini와 같은 외부 LLM을 호출할 수 있게 될 전망입니다. 이는 사용자가 각 모델의 강점을 활용해 더 다양한 작업 수행이 가능함을 의미합니다. 특히 Claude의 추론 능력이나 Gemini의 멀티모달 기능을 Siri보다 효율적으로 활용할 수 있을 것으로 기대됩니다. 개인 맞춤형 AI 비서 경험의 새로운 지평을 열 것입니다.
대부분의 MCP 서버는 엔티티 추출, 임베딩, 또는 랭킹을 위해 LLM을 호출합니다. 하지만 Kremis는 Rust로 작성된 그래프 스토어로, 엔티티-속성-값 트리플을 입력받아 결정론적 그래프를 구축하고, 쿼리에 대한 정확한 결과를 반환합니다. Kremis MCP 브리지는 HTTP 요청을 Kremis 서버로 프록시하는 stdio 프로세스로, 외부 API를 호출하지 않습니다. 이 접근법은 지식 그래프의 정확성과 일관성을 제공합니다.
아이리시 치과 병원이 연간 2만4천 유로짜리 콜센터를 1,200유로짜리 AI 에이전트로 교체한 사례다. 기존 콜센터는 시스템과 단절돼 메시지 전달만 가능했지만, AI는 병원 관리 시스템 API와 직접 연결되어 실시간으로 예약 가능 여부를 확인하고 슬롯을 확정한다. 환자 통화 90초 내 예약 완료라는 점에서 운영 효율성이 극대화됐다.
Claude Code의 핵심 '툴 시스템'은 AI 모델의 추상적인 의도를 실제 엔지니어링 액션으로 전환합니다. 모델이 직접 코드를 실행하거나 파일을 수정하지 않고, 툴 시스템이 의도를 해석, 검증, 실행하며 세션에 반영합니다. 프로젝트 검색, 파일 읽기, 코드 편집, 테스트 실행 등 복잡한 작업이 이 시스템을 통해 가능해집니다. 이는 LLM이 단순히 텍스트를 생성하는 것을 넘어, 실제 개발 워크플로우를 자동화하는 핵심 계층입니다.
허깅페이스에 사용자가 원치 않는 계정, 모델, 기업, 특정 언어/하드웨어 관련 콘텐츠를 차단할 수 있는 기능 요청이 올라왔습니다. 방대한 모델과 데이터셋 속에서 개인에게 불필요한 노이즈를 줄여 검색 효율성을 높이고, 플랫폼 경험을 개선하려는 움직임입니다. 이는 정보 과부하 시대에 필수적인 개인화된 콘텐츠 소비 흐름을 반영합니다.
APL, Matlab, R 같은 배열 언어는 강력하지만, 가독성 저하와 높은 버그 발생률이 단점으로 꼽혔습니다. 이 글은 변수의 '가변성'을 다차원 공간의 차원으로 보고, 암묵적 의존성에서 오는 버그를 줄이는 새로운 패러다임을 제안합니다. 이를 통해 더 적은 코드로 더 많은 것을 표현하고, 오류 검사를 강화하며, 기존보다 효율적인 배열 처리를 목표합니다. 복잡한 데이터 처리 로직을 명확하고 안전하게 구현할 새로운 접근법을 제시합니다.