Chatbot Arena
LMSYS 연구소에서 운영하는 블라인드 투표 시스템으로, 두 모델의 익명 응답을 사용자가 상호 비교하여 선호도를 평가하는 플랫폼입니다.
인간 선호도가 직접 반영되는 가장 신뢰도 높은 순위표입니다. 정형화된 지표가 놓치기 쉬운 실제 체감 성능을 포착합니다.