Constitutional AI
사람의 지속적인 직접 개입 대신 명문화된 기본 원칙과 규범 목록을 모델에 제시하고, 이를 준수하도록 스스로 비판 및 정렬 학습을 진행하게 만드는 기술입니다.
대규모 라벨링 비용 부담을 덜고 가치 정렬을 고도화하는 방안입니다. 규범적 가치를 일관되게 주입하는 데 유용합니다.