AI 4건 · 일반 1건
MedQA는 AMD ROCm을 사용하여 훈련된 의료 질문 답변 모델입니다. 이 모델은 LoRA fine-tuning을 통해 Qwen3-1.7B 모델을 기반으로 하며, AMD Instinct MI300X 하드웨어에서 CUDA 없이 훈련되었습니다. MedQA는 다중 선택형 의료 질문에 대한 답변과 함께 임상적 이유를 제공합니다. 이 프로젝트는 AMD 하드웨어에서 의료 AI 모델을 훈련시키는 가능성을 보여줍니다.
hpke-ng는 Rust로 구현된 HPKE 라이브러리이며, 기존의 hpke-rs 라이브러리보다 더 빠르고 작은 구현체입니다. hpke-ng는 44개의 벤치마크 테스트에서 hpke-rs를 상회하는 성능을 보여주었습니다. 이는 hpke-ng의 더 효율적인 프레임워크와 메모리 관리 덕분입니다. hpke-ng는 Apache-2.0과 MIT 라이선스를 지원하며, cargo를 통해 쉽게 설치할 수 있습니다.
바이오메드 아레나(BioMedArena)는 생의학 분야 딥 리서치 에이전트 개발 및 평가를 위한 오픈소스 툴킷입니다. 개별 논문마다 상이하던 에이전트 평가 환경을 표준화하여 '논문별 엔지니어링 비용'을 제거합니다. 벤치마크 로딩, 툴 노출, 선택, 실행, 컨텍스트 관리, 점수 산정 등 6가지 평가 레이어를 분리합니다. 이를 통해 147개 벤치마크와 75개 바이오 툴을 제공하며, 새로운 모델, 벤치마크, 툴 추가가 몇 줄의 어댑터 등록으로 간소화됩니다.
Anthropic의 Claude Code는 강력하지만, 토큰 제한과 비용 부담이 컸다. Docker Model Runner와 결합하면 클라우드 API 의존 없이 로컬 환경에서 Claude Code의 성능을 그대로 활용할 수 있다. 특히 민감한 데이터를 다루거나 오프라인 환경에서의 개발 생산성을 높이는 데 유리하다. 별도의 모델 실행 환경 구성 없이 Docker 기반으로 손쉽게 LLM을 로컬에서 구동하며 개발 워크플로우를 개선할 수 있다.
기존 LLM 에이전트 프레임워크는 신뢰성 문제를 묶음으로 제공했지만, 'agent-stack'은 이를 해체했습니다. 컨텍스트 관리, 네트워크 보안 등 특정 실패 모드에 대응하는 6가지 경량 라이브러리 세트입니다. 각 라이브러리는 의존성 없고 500줄 미만의 코드로 개별 배포되어, 기존 스택에 쉽게 통합할 수 있습니다. 무거운 프레임워크 없이 필요한 기능만 골라 에이전트의 안정성을 높이는 새로운 접근법을 제시합니다.