하이브리드 검색
용어 이름 복사
AI 개념약 1분 읽기
전통적인 키워드 매칭(BM25)과 인공지능 기반의 의미론적 벡터 검색을 결합하여, 정확한 단어 일치와 맥락적 이해를 동시에 수행함으로써 검색의 정밀도와 재현율을 최적화하는 기술입니다.
다른 이름
Hybrid Search복합 검색
상세 설명
하이브리드 검색은 텍스트의 표면적 일치를 찾는 키워드 기반 검색(Sparse Retrieval)과 데이터의 의미적 유사성을 파악하는 벡터 검색(Dense Retrieval)의 장점을 통합한 방식입니다. BM25 알고리즘을 통해 고유 명사나 제품 번호 같은 정밀한 키워드를 식별하며, 임베딩 모델을 통해 사용자의 질문 의도와 추상적인 문맥을 파악합니다. 분리된 두 검색 결과는 상호 순위 결합(RRF, Reciprocal Rank Fusion)이나 가중치 기반 합산(Alpha Tuning)을 통해 하나의 정렬된 리스트로 통합됩니다. 이 기술은 특히 RAG(검색 증강 생성) 시스템에서 전문 용어나 약어에 대한 검색 실패를 방지하고, 환각 현상을 줄여 답변의 신뢰성을 높이는 핵심 인프라로 작용합니다. 대규모 데이터셋에서도 고유 명사와 맥락을 모두 놓치지 않는 최적의 정보 인출 성능을 제공합니다.
도구 선택에서 중요한 이유
벡터 검색만으로는 제품 일련번호, 법률 조항 번호, 사람 이름과 같은 '정확한 매칭'이 필요한 데이터에서 치명적인 오답을 낼 수 있습니다. 하이브리드 검색을 지원하는 솔루션은 이러한 키워드 손실을 방지하여 비즈니스 환경에서 요구되는 정확도를 확보해줍니다.
확인할 점
- 키워드(BM25)와 벡터 가중치를 수동 또는 자동으로 조절(Alpha Tuning)할 수 있는가?
- RRF(Reciprocal Rank Fusion)와 같이 검증된 순위 통합 알고리즘을 지원하는가?
- 형태소 분석기 지원을 통해 한국어와 같은 교착어에 대한 키워드 검색 성능이 보장되는가?
- 하이브리드 검색 시 발생하는 지연 시간(Latency)이 서비스 요구사항에 부합하는가?
예시
사용자가 'iPhone 15 Pro 최저가'를 검색할 때, 키워드 검색으로 'iPhone 15 Pro'라는 정확한 모델명을 추려내고, 벡터 검색으로 '저렴한 가격'이나 '할인 정책' 등의 의미를 파악하여 두 결과가 적절히 조합된 최적의 상품 정보를 상단에 배치합니다.
관련 용어
vector-searchRAG
RAG는 실시간 데이터베이스 검색 결과를 AI 답변에 결합하는 기술입니다. 단순히 문서를 찾는 'Naive RAG'를 넘어, AI가 스스로 검색과 검증을 반복하는 '에이전틱 RAG'로 진화했습니다. 대규모 데이터를 ...
bm25의미 검색키워드 일치가 아니라 질의의 의미와 의도를 이해해 관련성 높은 결과를 찾는 검색 기술입니다.