정보 생성 전에 외부 지식 베이스에서 관련 문서를 검색하여 LLM의 응답을 보강하는 방식입니다.
모델 내부 지식만으로는 기업 문서·내부 데이터·최신 정보를 안정적으로 다룰 수 없기 때문이다.
RAG의 핵심은 검색이 아니라 검색 품질을 측정하고 반복 개선하는 운영 루프다.
Vector DB만 붙이면 RAG가 완성된다고 착각하는 것.
2026년 기준 RAG의 차이는 저장소가 아니라 chunking, reranking, eval, observability를 얼마나 촘촘히 묶느냐에서 난다.