Stable Diffusion

AI 개념

약 1분 읽기

Stability AI가 공개한 오픈소스 텍스트-이미지 생성 모델로, 잠재 확산 모델을 기반으로 합니다.

다른 이름

스테이블 디퓨전SD

상세 설명

Stable Diffusion은 Stability AI가 2022년 공개한 오픈소스 텍스트-이미지 생성 모델입니다. 잠재 확산 모델(Latent Diffusion Model)을 기반으로, 노이즈에서 시작해 단계적으로 잡음을 제거하며 텍스트 프롬프트에 맞는 이미지를 만들어 냅니다. 가장 큰 특징은 모델 가중치가 공개되어 개인 PC나 자체 서버에서 직접 실행하고 미세조정할 수 있다는 점입니다. 이를 토대로 Automatic1111, ComfyUI 같은 인터페이스와 LoRA·ControlNet 등 확장 기법 생태계가 형성됐으며, 일러스트·컨셉 아트·제품 시안 등 창작 작업에 폭넓게 쓰입니다.

도구 선택에서 중요한 이유

Stable Diffusion 계열 도구는 가중치가 공개돼 있어, 클라우드 API형 생성 도구와 달리 로컬 실행·자체 호스팅·세밀한 커스터마이즈가 가능합니다. 데이터를 외부로 보내지 않아야 하거나, 특정 화풍을 학습시켜야 하거나, 사용량 기반 과금 대신 한 번 구축해 무제한 생성하려는 경우 선택지가 됩니다. 다만 GPU 자원과 설정 부담이 따른다는 점을 함께 고려해야 합니다.

도입 전 확인할 점

로컬 실행에 필요한 GPU 메모리(VRAM)를 갖추고 있는가
원하는 화풍·해상도를 내는 체크포인트나 LoRA가 공개돼 있는가
생성 결과의 상업적 이용 라이선스 조건을 확인했는가
API형 도구 대비 구축·운영 비용이 실제로 유리한가

실제 적용 예시

외부에 시안을 보낼 수 없는 사내 디자인 팀이 자체 서버에 Stable Diffusion을 올리고, 자사 제품 이미지를 학습한 LoRA를 결합해 일관된 톤의 제품 컨셉 이미지를 대량 생성하는 식으로 활용합니다. 클라우드 생성 도구라면 어려운, 데이터 보안과 화풍 통제를 동시에 잡는 사례입니다.