
스테이블 디퓨전
Stable Diffusion
텍스트 설명을 바탕으로 정교한 이미지를 생성하는 오픈 소스 딥러닝 모델
검증된 사실
- 라이브 가격
- Free · 무료2026-06-20 확인
- GitHub
- ★ 27,171
- 최근 변경
- 2026-05-20 Stability Audio 3.0 출시: 최대 6분 20초 전문가급 음악 생성 모델 4종. 소스: https://techcrunch.com/2026/05/20/stability-ai-releas
2026-06-20 직접 확인 · 자동 검증 데이터
제품 화면

2026-06-20 확인
도구 선택 가이드
스테이블 디퓨전은 텍스트 설명을 바탕으로 정교한 이미지를 생성하는 오픈 소스 딥러닝 모델.
추천 대상
- SD 1.5·SDXL은 무료로 로컬 설치 가능하고, 연매출 $1M 미만 사업자는 SD 3.5도 Community License로 무료 상업 이용
- ControlNet·LoRA·inpainting/outpainting·ComfyUI 등 세밀한 커스터마이징을 오픈소스 생태계로 지원
- API 기준 SD 3.5 Large 이미지 1장 $0.065, Turbo $0.04로 비용 효율적
피해야 할 경우
- 연매출 $1M을 넘는 기업은 SD 3/3.5에 별도 Enterprise 라이선스 계약이 필요
- 로컬 실행은 SDXL 기준 최소 8GB VRAM, 고해상도는 24GB+ 권장으로 하드웨어 장벽이 있음
- 공식 웹 UI가 없어 로컬 설치나 서드파티 플랫폼을 거쳐야 해 비기술 사용자에겐 초기 설정이 부담
가격 정보
개인·연구용 커뮤니티 라이선스는 무료. 연 매출 100만 달러 미만 상업 이용은 월 $20 Professional 멤버십. 그 이상 규모 기업은 Enterprise 계약 필요. API 사용 시 1,000 크레딧당 $10 종량제.
활용 사례AI 요약
ControlNet·LoRA로 특정 인물·스타일·구도를 유지한 상업용 이미지와 콘셉트 아트 제작
inpainting/outpainting으로 배경 교체·객체 제거·이미지 확장 편집
ComfyUI 워크플로우로 상품 이미지·게임 에셋을 배치 생성하는 파이프라인 자동화
최근 업데이트와 소식
- 소식2025년 NVIDIA 협력: TensorRT 최적화로 SD3.5 Large 2.3x 속도 향상, VRAM 40% 절감.
2025년 NVIDIA 협력: TensorRT 최적화로 SD3.5 Large 2.3x 속도 향상, VRAM 40% 절감.
- 버전 업데이트Stability Audio 3.0 출시: 최대 6분 20초 전문가급 음악 생성 모델 4종.
Stability Audio 3.0 출시: 최대 6분 20초 전문가급 음악 생성 모델 4종.
- 소식SD 3.5 Large ControlNet 3종(Blur/Canny/Depth) 추가.
SD 3.5 Large ControlNet 3종(Blur/Canny/Depth) 추가.
소개AI 요약
활용 워크플로우
게임 컨셉 아트 디자이너가 RPG 게임 내 캐릭터의 특정 포즈와 장갑 디자인 시안 도출할 때
프롬프트 및 ControlNet 설정
텍스트 프롬프트와 함께 ControlNet OpenPose를 사용하여 캐릭터의 뼈대 좌표와 구도를 수동으로 입력
SD 3.5 Large 체크포인트 연산
MMDiT 아키텍처 기반의 모델이 로컬 GPU 가속을 통해 프롬프트와 포즈를 일치시키는 텐서 연산 수행
고해상도 업스케일링 시안
Hires. fix 기능을 적용하여 노이즈를 제거하고 디테일이 강화된 4K 해상도의 캐릭터 컨셉 아트 완성
핵심 차별점: ControlNet과 LoRA를 통해 이미지의 구조와 화풍을 픽셀 단위로 정밀 제어할 수 있는 강력한 오픈 소스 자유도
주요 기능AI 요약
장점 & 단점AI 분석
공식 정보와 공개 피드백을 함께 정리한 참고 메모입니다
장점
- SD 1.5·SDXL은 무료로 로컬 설치 가능하고, 연매출 $1M 미만 사업자는 SD 3.5도 Community License로 무료 상업 이용
- ControlNet·LoRA·inpainting/outpainting·ComfyUI 등 세밀한 커스터마이징을 오픈소스 생태계로 지원
- API 기준 SD 3.5 Large 이미지 1장 $0.065, Turbo $0.04로 비용 효율적
단점
- 연매출 $1M을 넘는 기업은 SD 3/3.5에 별도 Enterprise 라이선스 계약이 필요
- 로컬 실행은 SDXL 기준 최소 8GB VRAM, 고해상도는 24GB+ 권장으로 하드웨어 장벽이 있음
- 공식 웹 UI가 없어 로컬 설치나 서드파티 플랫폼을 거쳐야 해 비기술 사용자에겐 초기 설정이 부담
사용자 리뷰
리뷰를 불러오는 중...
대안 도구
이 도구 대신 사용할 수 있는 대안
업스케일 미디어
PixelBin (by Fynd)
인공지능 기술로 저해상도 이미지를 최대 4배까지 선명하게 확대하는 서비스
리크래프트
디자이너를 위한 고품질 벡터 아트 및 브랜드 스타일 생성 AI
씨아트
수만 개의 AI 모델과 Flux·Veo 최신 기술로 이미지·동영상을 브라우저에서 생성하는 AI 아트 플랫폼
크레아 AI
스케치에 즉시 반응하는 실시간 AI 생성 엔진과 체인 워크플로우로 창작 과정을 혁신하는 크리에이티브 스위트
매그니피크 AI
픽셀을 늘리는 것을 넘어 AI가 이미지 디테일을 창조적으로 재구성하는 혁신적 업스케일러
오토매틱1111
로컬 GPU에서 Stable Diffusion을 완전 제어하는 가장 인기 있는 오픈소스 이미지 생성 웹 UI