서버리스
용어 이름 복사
인프라약 1분 읽기
인프라 관리 없이 코드나 서비스를 실행하며, 실제 사용량(호출 횟수, 실행 시간)에 따라 자동 확장 및 비용이 청구되는 클라우드 컴퓨팅 모델입니다.
다른 이름
Serverless서버리스 컴퓨팅
상세 설명
서버리스는 개발자가 서버의 프로비저닝, 관리, 확장을 신경 쓰지 않고 애플리케이션의 핵심 로직에만 집중할 수 있도록 돕는 실행 모델입니다. '서버가 없다'는 뜻이 아니라, 인프라 관리를 클라우드 서비스 제공업체가 완전히 대행함을 의미합니다.
최근 AI 분야에서는 고가의 GPU를 상시 가동하는 대신, 요청이 있을 때만 가동하고 사용하지 않을 때는 비용을 '0'으로 만드는 '서버리스 GPU'가 핵심 기술로 부상했습니다. 이는 트래픽이 불규칙한 AI 서비스의 운영 비용을 극적으로 절감하고, 인프라 운영 부담 없이 빠른 시장 진입을 가능하게 합니다.
AI 도구 선택에서 중요한 이유
AI 모델은 고사양 GPU를 필요로 하여 상시 구동 시 고정 비용이 매우 높습니다. 서버리스 모델을 선택하면 사용자 요청이 적은 시간대의 유휴 GPU 비용을 절감할 수 있고, 갑작스러운 트래픽 증가에도 자동으로 대응할 수 있어 스타트업의 초기 비용 최적화에 필수적입니다.
도구 선택 시 확인 사항
- 콜드 스타트(Cold Start): 유휴 상태에서 첫 요청 처리 시 발생하는 지연 시간이 AI 모델 크기에 따라 허용 가능한 수준인가?
- 최대 실행 시간: 긴 추론 시간이 필요한 생성 AI 모델의 경우 플랫폼의 타임아웃 제한에 걸리지 않는가?
- GPU 가용성: 필요 시 NVIDIA A100, H100 등 고성능 GPU 자원을 즉각 할당받을 수 있는가?
실제 활용 사례
사용자가 텍스트를 입력할 때만 가동되어 이미지를 생성하는 Stable Diffusion API, 평소에는 대기 상태이다가 질문이 들어올 때만 답변을 생성하는 커스텀 LLM 챗봇 백엔드 등에 주로 활용됩니다.
인프라 모델 비교
IaaS (Infrastructure as a Service)
가상 서버를 직접 구매/관리. 유연성이 높으나 운영 부담과 유휴 비용이 큼.
Serverless (FaaS/GPU)
운영 관리가 전무하며 쓴 만큼만 결제. '0'으로 스케일링 가능하나 초기 지연(Cold Start) 가능성 있음.
관련 용어
faasgpu-serverless콜드 스타트 (Cold Start)
AI 시스템이 비활성 상태에서 가동될 때 발생하는 응답 지연 시간, 또는 추천 시스템에서 데이터 부족으로 신규 사용자에게 정확한 결과를 제공하지 못하는 현상을 뜻합니다.
auto-scaling