AI 2건 · 일반 2건
기존 swe-bench는 LLM 평가에 한계가 있었다. DeepSWE는 최초의 에이전틱 코드 벤치마크로서 이러한 문제를 해결한다. 개발자는 이를 통해 LLM의 실제 코드 생성 및 이해 능력을 더욱 정확하게 측정할 수 있다. 이는 LLM 기반 코드 어시스턴트의 발전 방향을 제시한다.
최근 오픈 모델 업데이트가 발표됐다. Ring, Command, StepFun, LFM 모델이 포함되어 있다. 이러한 모델은 AI 개발에 새로운 기회를 제공한다. 업데이트된 모델은 다양한에 적용될 수 있다. 개발자들은 이러한 모델을 활용하여 새로운 애플리케이션을 개발할 수 있다.
Legacy Labs는 2009년 스타일의 시스템 관리자링을 시도하는 이벤트를 개최한다. 이 이벤트는 낮은 사양의 컴퓨터와 구식 운영 체제를 사용하여 가능한 한 많은 것을 수행하는 것을 목표로 한다. 이는 새로운 기술을 배우고 실험하는 기회를 제공한다. 이 이벤트는 개발자들이 새로운 기술을 익히고 구식 기술을 되살리는 데 도움이 될 수 있다. 구식 시스템을 사용하여 새로운 기술을 개발하는 것은 도전이 될 수 있지만, 새로운 기술을 배우는 데 도움이 될 수 있다.
Meta의 법적 조치로 인해 페이스북 내부 고발자가 Hay Festival에서 침묵을 강요당했다. 해당 고발자는 Meta의 법적 제재 가능성 때문에 발언을 삼갔다. 이는 Meta의 내부 문화와 의사 결정에 대한 폭로를 막으려는 시도로 해석된다. Hay Festival 프로그램 디렉터는 이 상황을 '침묵당한 이들을 위한 연대의 중요한 행위'라고 규정했다.