RAG

AI 개념
1분 읽기

RAG(검색 증강 생성)는 AI 모델이 외부 데이터베이스에서 관련 정보를 실시간으로 검색한 뒤, 이를 바탕으로 답변을 생성하는 기술입니다. 모델의 학습 데이터에 없는 최신 정보나 기업 내부 문서를 활용해 답변의 정확도를 높이고 AI의 환각(Hallucination) 현상을 획기적으로 줄여줍니다.

다른 이름
검색 증강 생성Retrieval-Augmented Generation

상세 설명

RAG는 2024-2025년 AI 산업의 핵심 표준으로 자리 잡았으며, 단순히 '검색 후 생성'을 넘어 지능형 지식 관리 시스템으로 진화하고 있습니다. 초기 방식인 'Naive RAG'는 벡터 유사도 기반의 검색에 의존했으나, 최근에는 검색 전 쿼리 최적화와 검색 후 결과 재정렬(Reranking)을 거치는 'Advanced RAG'가 주류입니다. 특히 마이크로소프트의 'GraphRAG'처럼 데이터 간의 복잡한 관계를 파악하는 지식 그래프 기술이 도입되어 다단계 추론 성능이 크게 강화되었습니다. 최신 LLM의 컨텍스트 윈도우가 확장되고 있음에도 불구하고, RAG는 낮은 운영 비용, 실시간 데이터 반영 속도, 그리고 답변의 출처를 명확히 제시하는 신뢰성(Groundedness) 덕분에 기업용 AI 구축에서 대체 불가능한 위치를 차지하고 있습니다.

도구 선택에서 중요한 이유

단순히 성능 좋은 LLM을 쓰는 것보다, 우리가 가진 데이터를 얼마나 정확하게 검색하여 주입하느냐가 AI 서비스의 품질을 결정합니다. 검색 품질이 낮으면 AI는 엉뚱한 문서를 근거로 잘못된 답변을 내놓기 때문입니다. 따라서 RAG 도구를 고를 때는 검색 알고리즘의 고도화 수준과 데이터 업데이트의 편의성을 최우선으로 고려해야 합니다.

도구 선택 시 확인해야 할 4가지

  • 단순 벡터 검색 외에 키워드 검색을 결합한 '하이브리드 검색'을 지원하는가?
  • 검색된 결과의 순위를 다시 매기는 '리랭킹(Reranking)' 과정이 포함되어 있는가?
  • RAGAS나 TruLens 같은 정량적인 RAG 성능 평가지표를 제공하는가?
  • 데이터가 변경되었을 때 실시간으로 인덱싱에 반영되는가?

실무 적용 예시

금융권에서 수만 페이지의 최신 규제 가이드라인 문서를 RAG로 구축하면, AI가 '올해 개정된 자본시장법 제3조에 대해 알려줘'라는 질문에 법령 원문을 찾아 근거 조항과 함께 정확한 답변을 생성합니다. 이는 모델을 새로 학습시키는 것보다 훨씬 저렴하고 빠르게 최신 정보를 반영하는 방법입니다.

헷갈리기 쉬운 개념

RAG vs 파인튜닝(Fine-tuning)

파인튜닝은 모델의 '능력(말투, 특정 작업)'을 개선하는 것이고, RAG는 모델에게 '교과서(최신 데이터)'를 쥐여주는 것입니다.

RAG vs Long Context

Long Context는 모든 데이터를 한꺼번에 읽히는 방식이라 비싸고 느리지만, RAG는 필요한 부분만 골라 읽으므로 훨씬 효율적입니다.

관련 용어

vector-database환각graphragrerankingragas