LLM-as-Judge
사람의 수동 평가 과정을 대체하기 위해, 최고 성능 수준의 고도화된 모델을 평가자로 지정하여 다른 모델의 출력을 검증하는 방법론입니다.
평가 자동화 파이프라인의 핵심 전략입니다. 상시 검증이 가능한 시스템을 저비용으로 구축하도록 도와줍니다.