AI 7건 · 일반 3건
에이전트의 실세계 지식 작업 능력을 평가하는 새로운 벤치마크가 등장했다. 이 벤치마크는 에이전트의 실세계 지식 작업 능력을 측정하기 위해 설계되었으며, 에이전트의 성능을 평가하는 데 도움이 된다. 이는 에이전트의 성능을 향상시키는 데 중요한 역할을 할 수 있다. 에이전트의 성능을 평가하는 데 사용되는 새로운 벤치마크다. 이 벤치마크는 에이전트의 실세계 지식 작업 능력을 평가한다.
Datasette 플러그인 datasette-apps가 공개됐다. 이 플러그인은 HTML, JavaScript 기반의 커스텀 앱을 Datasette 내부에 샌드박스 형태로 호스팅한다. 앱은 JavaScript를 사용해 Datasette 데이터에 대한 SQL 쿼리를 실행하며, 설정에 따라 쓰기 쿼리도 가능하다. 이를 통해 데이터 시각화 및 상호작용 기능을 Datasette에 직접 통합할 수 있다.
OpenAI 모델은 유해 행동에 대한 저항력을 테스트했다. 모델은 유해한 행동으로 유도하기가 어려웠고, 도움이 되는 지침에는 반응했다. 또한 유해한 미세 조정에 대한 저항력이 증가했다. 이 결과는 모델의 안정성과 안전성을 높이는 데 도움이 될 수 있다. 모델의 성능과 안정성을 향상시키기 위한 연구가 계속 진행 중이다. 이러한 연구는 모델의 안전성과 안정성을 높이는 데 중요한 역할을 한다.
MosaicLeaks는 연구 에이전트가 외부 도구와 개인 문서를 결합하여 개인 정보를 유출할 수 있는 위험을 제기한다. 이 문제는 에이전트의 외부 쿼리가 개인 정보를 유출할 수 있기 때문에 발생한다. 연구자들은 MosaicLeaks를 통해 개인 정보 유출을 방지하는 새로운 훈련 방법을 제안한다. 이 방법은 에이전트가 개인 정보를 유출하지 않도록 훈련하는 것이다. 연구 결과, 에이전트가 개인 정보를 유출하는 경우가 줄어들었다. 이 연구는 개인 정보를 다루는 연구 에이전트의 개발에 중요한 의미를 가진다. MosaicLeaks는 개인 정보를 보호하는 새로운 연구 과제를 제안한다. 이 방법은 에이전트가 개인 정보를 유출하는 경우를 줄이고, 개인 정보를 보호하는 데 도움이 된다.
Unsloth Studio에서 GLM 5.2 GGUFs를 지원하기 시작했다. 모든 이유 레벨을 지원하며, 새로운 자동 맞춤 알고리즘을 통해 3배 더 긴 컨텍스트 길이를 달성할 수 있다. 또한, 보안 HTTPS 글로벌 액세스를 위한 `unsloth studio --secure` 명령을 사용할 수 있다. Unsloth Studio의 최신 버전을 설치하거나 업데이트하려면 `2026.6.8` 또는 `v0.1.47-beta` 버전을 사용해야 한다.
datasette-acl 0.6a0이 출시됐다. 이 버전은 테이블 권한만을 관리하던 이전 버전과는 달리, 더 일반적인 리소스 공유 시스템을 제공한다. Alex Garcia가 대부분의 작업을 수행했다. Datasette 인스턴스에서 사용자별로 리소스 접근을 세부적으로 제어할 수 있는 플러그인을 개발 중이다. 이 기능은 Datasette 사용자에게 더 많은 유연성과 보안을 제공할 것이다. Datasette-acl은 Datasette의 보안과 접근성에 기여할 것이다.
LanceDB v0.31.0-beta.0이 출시됐다. 이 버전에서는 IndexStatistics에서 사용되지 않는 loss 필드를 제거하고, REST 변형을 위한 set/unset_lsm_write_spec을 구현하였으며, 테이블 브랜치 지원을 추가하였습니다. 또한 FM-Index 스칼라 인덱스를 위한 substring 검색을 지원한다. 이러한 변경 사항은 LanceDB의 성능과 사용 편의성을 향상시키는 데 도움이 된다. 개발자들은 이러한 새로운 기능을 활용하여 더 나은 데이터 관리와 분석을 수행할 수 있다. LanceDB는 데이터베이스 관리를 더 효율적으로 만들어준다.
Continue v2.0.0이 출시됐다. 이 버전은 VSCode와 호환되며, 개발자들이 코드를 더 효율적으로 관리할 수 있도록 도와준다. Continue는 코드베이스를 분석하고, 디버깅을 쉽게 해주는 도구이다. 이 도구를 사용하면 개발자들이 코드를 더 빠르게 작성하고, 오류를 쉽게 찾을 수 있다. 또한, Continue는 코드를 더 읽기 쉽게 만들어주어, 개발자들이 코드를 더 쉽게 이해할 수 있다.
Enterprise-Managed Authorization 확장이 안정화됐다. 이 확장을 통해 조직은 MCP 서버와 사용자 인증을 중앙에서 관리할 수 있다. 사용자는 이제 단일 로그인으로 모든 연결된 MCP 서버에 접근할 수 있다. 이 확장은 Anthropic, Microsoft, Okta 등 여러 MCP 서버에서 채택되고 있다. 이 확장을 사용하면 사용자는 처음 로그인할 때 MCP 서버가 자동으로 연결되므로 별도의 설정이 필요 없다.
여러 개의 Pull Request가 서로 의존하는 Stacked PR 환경에서, 하위 PR의 기준 커밋이 변경되면 Git 이력이 꼬인다. `git rebase --onto` 명령어는 특정 커밋의 부모를 새로운 커밋으로 명시적으로 재지정한다. 이는 변경된 부모 커밋 위에 쌓인 Stacked PR들을 효율적으로 재정렬하는 데 사용된다. 복잡한 Git 히스토리 관리에서 일관성을 유지하고 충돌을 방지한다.