쿠버네티스

기술 용어
1분 읽기

컨테이너화된 애플리케이션의 배포·확장·운영을 자동화하는 오픈소스 오케스트레이션 플랫폼입니다.

다른 이름
KubernetesK8s쿠베네티스

상세 설명

쿠버네티스(Kubernetes, K8s)는 구글이 개발하고 CNCF가 관리하는 오픈소스 컨테이너 오케스트레이션 플랫폼입니다. Docker 등으로 컨테이너화한 애플리케이션의 배포, 확장, 복구, 부하 분산을 자동화합니다. 트래픽에 따라 인스턴스를 자동으로 늘리고 줄이는 오토스케일링, 무중단 배포를 위한 롤링 업데이트, 장애가 난 컨테이너를 스스로 되살리는 셀프 힐링이 핵심 기능입니다. 대규모 AI 모델 서빙, 마이크로서비스 운영, 멀티 클라우드 배포에 널리 쓰이며, AWS EKS·Google GKE·Azure AKS 같은 관리형 서비스로 운영 부담을 줄일 수 있습니다.

도구 선택에서 중요한 이유

AI 모델을 여러 사용자에게 안정적으로 서빙하려면 트래픽 변동에 따른 확장과 장애 복구가 필요합니다. 쿠버네티스 기반 배포를 지원하는 도구를 쓰면 수요에 맞춰 자원을 자동 조절하고 무중단 업데이트를 할 수 있습니다. 다만 운영 복잡도가 높아, 관리형 서비스 지원 여부를 함께 보는 것이 좋습니다.

도구를 고를 때 확인할 점

  • GPU 자원 스케줄링과 오토스케일링을 지원하는가
  • 무중단 롤링 배포와 자동 복구가 가능한가
  • 관리형 쿠버네티스(EKS·GKE·AKS)와 호환되는가
  • 운영 복잡도 대비 우리 팀의 운영 역량이 충분한가

실제 적용 예시

이미지 생성 API의 사용량이 낮 시간에 몰린다면, 쿠버네티스가 요청량에 맞춰 GPU 파드를 자동으로 늘렸다가 한가한 새벽에 줄입니다. 덕분에 상시 대형 서버를 띄워 두지 않고도 응답 지연을 막으면서 비용을 절감합니다.

관련 용어

Docker마이크로서비스클라우드DevOps