오늘의 뉴스매일 4슬롯 종합 큐레이션 전체 슬롯원문 슬롯 · 10 / 14 / 18 / 22 KST Blog Repos오늘의 픽 · 지식 기반 인터랙티브 그래프1650+

Build Stack

Prompts오늘의 픽 · 코드베이스 분석350+Skills오늘의 픽 · 코드 간결화 도구150+MCP오늘의 픽 · mcp-for-beginners300+Workflows오늘의 픽 · Claude Code 환경 처음 세팅100+

Community PlaygroundNEW SubscribeNEW

Privacy Policy Terms & Conditions

LatticeAI Intelligence PlatformAI 인텔리전스 플랫폼

Blog블로그 Atlas아틀라스

Community커뮤니티BETA Playground플레이그라운드NEW

Today's News오늘의 뉴스 Current News Slot전체 슬롯 Blog블로그 Atlas아틀라스 Community커뮤니티BETA Playground플레이그라운드NEW

AI-NativeAI 네이티브

Repos레포 Prompts프롬프트 Skills스킬 MCPMCP Workflows워크플로우

© 2026 Lattice

Subscribe AI Atlas 프롬프트 Telegram News Contact GitHub

마지막 업데이트: 13분 전

판사로서의 LLM · LLM-as-Judge · Lattice Atlas · Lattice

오늘의 뉴스매일 4슬롯 종합 큐레이션 전체 슬롯원문 슬롯 · 10 / 14 / 18 / 22 KST Blog Repos오늘의 픽 · 지식 기반 인터랙티브 그래프1650+

Build Stack

Prompts오늘의 픽 · 코드베이스 분석350+Skills오늘의 픽 · 코드 간결화 도구150+MCP오늘의 픽 · mcp-for-beginners300+

LatticeAI Intelligence PlatformAI 인텔리전스 플랫폼

Blog블로그 Atlas아틀라스

Community커뮤니티BETA Playground플레이그라운드NEW

Today's News오늘의 뉴스 Current News Slot전체 슬롯 Blog블로그 Atlas아틀라스 Community커뮤니티BETA Playground플레이그라운드NEW

AI-NativeAI 네이티브

Repos레포 Prompts프롬프트 Skills스킬 MCPMCP Workflows워크플로우

Atlas/Evaluation

판사로서의 LLM

LLM-as-Judge

EvaluationPrimary#66

사람의 수동 평가 과정을 대체하기 위해, 최고 성능 수준의 고도화된 모델을 평가자로 지정하여 다른 모델의 출력을 검증하는 방법론입니다.

왜 지금 중요한가

평가 자동화 파이프라인의 핵심 전략입니다. 상시 검증이 가능한 시스템을 저비용으로 구축하도록 도와줍니다.

관련 개념

쌍체 비교 평가Pairwise Comparison
평가 데이터셋Eval Set
MT-Bench
벤치마크Benchmark

© 2026 Lattice

Subscribe AI Atlas 프롬프트 Telegram News Contact GitHub

Open in Atlas Universe

Workflows오늘의 픽 · Claude Code 환경 처음 세팅100+

Terms & Conditions

마지막 업데이트: 13분 전