Zero-shot

AI 개념

약 1분 읽기

별도의 학습 데이터나 예시(Few-shot) 없이, 모델이 사전 학습된 지식과 자연어 지시(Prompt)만으로 새로운 작업을 즉각 수행하는 능력입니다.

다른 이름

Zero-shot Learning제로샷

상세 설명

Zero-shot은 AI 모델이 특정 작업에 대한 구체적인 예시를 참조하지 않고도 사용자의 의도를 파악하여 결과물을 생성하는 기법입니다. 이는 대규모 언어 모델(LLM)이 방대한 데이터를 학습하며 축적한 개념 간의 관계와 논리적 추론 능력을 바탕으로 합니다. 사용자가 번역 예시를 주지 않고도 "이 문장을 영어로 번역해줘"라고 요청했을 때 수행하는 것이 대표적입니다. 별도의 예시(Shot)가 포함되지 않으므로 토큰 소모가 적고 응답 속도가 빠르지만, 모델의 사전 학습 범위를 벗어난 특수한 전문 분야나 복잡한 출력 형식이 필요한 작업에서는 성능이 제한될 수 있습니다.

도구 선택에서 중요한 이유

Zero-shot 성능은 해당 AI 모델의 기초 체력을 의미합니다. Zero-shot 성능이 뛰어난 모델을 선택하면 예시를 구성하는 번거로움이 줄어들고, 프롬프트 길이를 최소화하여 API 비용(토큰)을 절감하고 실시간 서비스의 지연 시간(Latency)을 단축할 수 있습니다.

확인할 점

지시문(Instruction)만으로 원하는 출력 형식(JSON, Markdown 등)을 정확히 지키는가?
모델이 해당 도메인의 상식이나 기본 개념을 충분히 이해하고 있는가?
복잡한 추론이 필요한 경우 Zero-shot 대신 Chain-of-Thought 기법이 필요한가?

예시

입력: "다음 문장의 감정을 분석해줘: '오늘 날씨가 너무 좋아서 산책하기 딱이야.'" 출력: "긍정" (참고: '긍정'이라는 결과에 대한 어떠한 예시 문장도 제공하지 않음)

헷갈리기 쉬운 용어

Few-shot

작업 수행을 돕기 위해 프롬프트 내에 2~5개 정도의 입출력 예시를 포함하는 방식입니다.

Fine-tuning

프롬프트가 아닌 모델 자체의 가중치를 특정 데이터셋으로 업데이트하여 성능을 최적화하는 과정입니다.

참고 링크

전체 용어 목록