AI 3건 · 일반 2건
최신 LLM 모델들의 등장으로 Llama 3.x 시리즈의 파인튜닝 가치가 희석되었는지 논의가 필요하다. 특히 70B 파라미터 모델의 경우, Qwen3와 같은 새로운 모델들과 비교했을 때 여전히 실험 및 파인튜닝에 적합한지 의문이 생긴다. Llama 3.x 모델들은 특정 작업에서 여전히 강력한 성능을 보일 수 있으며, 비교적 쉬운 접근성은 파인튜닝 시도를 장려한다. 하지만 최신 모델들의 성능 향상을 고려할 때, 목적에 맞는 최적의 모델 선택이 중요하다.
LLM 에이전트가 파일, 웹, API 등 외부 환경 데이터를 과신하는 문제점을 지적한다. 에이전트는 이런 관찰에 기반해 도구 사용, 상태 추적, 행동을 결정하지만, 데이터 신뢰성과 권한은 불확실할 때가 많다. 기존 에이전트 벤치마크는 주로 작업 능력이나 특정 공격에 초점을 맞추었으나, 환경 데이터의 정확성 저하 시 에이전트의 신뢰성 문제는 다루지 않았다. 이 연구는 에이전트가 잘못된 환경 데이터를 참으로 간주하는 '증거-기반 결함(EGD)'을 정의하고, 이를 평가하는 EnvTrustBench 프레임워크를 제안한다.
본 연구는 Deep Sets 및 Janossy Pooling 신경망 아키텍처의 보편성을 위한 임베딩 차원의 하한을 다룬다. 점군(point clouds)과 같이 순열 대칭성을 갖는 데이터 처리에서 이러한 인variant 네트워크 구성은 중요하다. 연구진은 새로운 기법을 활용하여 요구되는 임베딩 차원의 하한에 대한 엄격한 증명을 제시한다. 특히 Deep Sets의 경우 d > 1에서 정확한 최소 차원을 상수 인자까지 제공하며, k > 1인 Janossy Pooling에 대한 최초의 비자명한 하한을 입증한다.
고등 수학 교육의 난해함은 학생뿐 아니라 전문가도 겪는 문제라는 지적이 나온다. 일부 대학 교재 증명은 초고수준 개요에 그쳐, 독자가 각 줄을 스스로 증명해야 하는 상황이다. 개인적인 관심으로 수학자들과 협업한 결과, 이들은 특정 증명의 중간 단계가 모호하다는 데 동의했다. 결국, 정확성·완전성·접근성을 갖춘 설명으로 다듬기까지 이틀이 걸린다.
Figma가 인수한 Weave 기술은 생성형 미디어를 디자인 워크플로 안에 통합하려는 시도다. 하지만 현재 공개된 Figma Weave는 UX 설계나 프로토타이핑보다는 콘텐츠 생성에 치중된 기능을 보여준다. 이는 디자인 시스템과 제품 제작 전반의 연결보다, 개별 자산 생성에 머무른다는 한계를 드러낸다. Figma가 진정한 AI 네이티브 도구로 진화할지 여부는 향후 확장 방향에 달렸다.