콜드 스타트 (Cold Start)

기술 용어
1분 읽기

AI 시스템이 비활성 상태에서 가동될 때 발생하는 응답 지연 시간, 또는 추천 시스템에서 데이터 부족으로 신규 사용자에게 정확한 결과를 제공하지 못하는 현상을 뜻합니다.

다른 이름
콜드 부트초기 구동 지연데이터 희소성 문제

상세 설명

콜드 스타트는 두 가지 핵심 맥락에서 이해해야 합니다. 첫째, 인프라 관점에서는 서버리스 환경(AWS Lambda, GCP Functions 등)에서 유휴 상태이던 모델 인스턴스가 첫 요청을 처리하기 위해 컴퓨팅 자원을 할당받고 코드와 런타임을 로드하는 과정에서 발생하는 지연(Latency)을 의미합니다. 이는 실시간 응답이 중요한 AI 서비스의 사용자 경험에 직접적인 영향을 미칩니다. 둘째, 데이터 관점에서는 추천 시스템이 신규 사용자나 아이템에 대한 과거 상호작용 이력이 없어 개인화된 결과를 도출하지 못하는 '데이터 부족' 상태를 말합니다. AI 도구 도입 시에는 이러한 인프라적 지연을 최소화하는 프로비저닝 기능이 있는지, 혹은 데이터 공백을 메울 수 있는 하이브리드 추천 로직(메타데이터 활용 등)을 갖추었는지 확인하는 것이 필수적입니다.

도구 선택에서 중요한 이유

콜드 스타트는 서비스의 '첫인상'을 결정합니다. 모델 로딩이 느리면 사용자는 이탈하며, 신규 유저에게 엉뚱한 추천을 제공하면 서비스 신뢰도가 하락합니다. 따라서 대규모 트래픽이나 신규 사용자 유입이 잦은 서비스일수록 콜드 스타트 제어 역량이 도구 선택의 핵심 기준이 됩니다.

확인할 점

  • 서버리스 환경에서 'Always-warm' 또는 프로비저닝된 동시성 기능을 제공하는가?
  • 신규 유저/아이템 발생 시 인기도 기반이나 메타데이터 기반의 대체 로직이 작동하는가?
  • 모델 배포 시 런타임 경량화 및 종속성 최적화가 지원되는가?

예시

새로 가입한 유저에게 과거 시청 기록이 없어 '가장 인기 있는 콘텐츠'를 먼저 보여주는 것은 데이터 콜드 스타트 대응이며, 새벽 시간대 미사용으로 잠들어 있던 이미지 생성 AI 모델이 첫 요청에 10초 이상 걸리는 것은 인프라 콜드 스타트 사례입니다.

관련 용어

레이턴시 (Latency)서버리스recommender-system