Jailbreak
모델에 주입된 내부 안전 가이드라인이나 정렬 규칙을 우회하여 시스템이 금지된 응답을 하도록 유도하는 악의적 프롬프트 공격 패턴입니다.
안전한 상용 서비스를 유지하기 위한 보안 고도화의 방어 대상입니다. 공격 기법과 방어 체계의 기술적 대립이 지속되고 있습니다.