Reranker
초기 단계에서 검색된 다수의 문서 후보군을 받아 정밀한 의미적 유사성을 기준으로 순위를 재조정하는 2단계 모델입니다.
embedding-only retrieval은 거의 항상 noise가 많아 LLM이 잘못된 컨텍스트를 받아들이는 문제가 생긴다.
reranker 한 단계만 추가해도 RAG 정확도가 체감될 정도로 올라가는 경우가 많다.
top-k를 크게 잡고 reranker 없이 LLM에 그대로 던지는 것.
2026년 RAG에서 reranking은 옵션이 아니라 default다. 비용은 작고 ROI가 비대칭적으로 크다.