모델이 제시한 임의의 소스코드 완성 표본들 k개 중에서, 단 하나라도 준비된 정답 단위 유닛 테스트를 완전 통과할 통계적 확률을 계측하는 평가 메트릭입니다.
코딩 보조 인공지능 성능을 정량화하는 표준 공식입니다. 모델의 실무적인 코드 신뢰도와 예외 발생 확률을 역추적하는 근거가 됩니다.