확산 모델
용어 이름 복사
AI 개념약 1분 읽기
노이즈에서 시작해 잡음을 단계적으로 제거하며 데이터를 생성하는, 이미지·영상 생성의 주류 AI 기법입니다.
다른 이름
Diffusion Model디퓨전 모델
상세 설명
확산 모델(Diffusion Model)은 데이터에 노이즈를 점점 더해 망가뜨리는 과정을 거꾸로 학습해, 무작위 노이즈에서 시작해 잡음을 단계적으로 제거하며 새로운 데이터를 생성하는 딥러닝 기법입니다. 현재 이미지·영상·오디오 생성의 주류 방식으로, Stable Diffusion·DALL·E·Midjourney 같은 텍스트-이미지 도구가 이 원리를 사용합니다. 과거 주류였던 GAN보다 학습이 안정적이고 결과 다양성이 높은 편이지만, 여러 단계를 거치므로 생성이 상대적으로 느립니다. 이를 보완하려 단계를 줄이는 가속 기법이 함께 발전하고 있습니다.
도구 선택에서 중요한 이유
이미지·영상 생성 도구 대부분이 확산 모델을 토대로 합니다. 구조를 직접 다룰 일은 없지만, 생성 단계 수가 속도와 품질을 좌우한다는 점을 알면 도구의 생성 속도·해상도·비용을 이해하고 비교하기 쉬워집니다. 빠른 미리보기가 중요한지, 최종 품질이 중요한지에 따라 적합한 도구가 갈립니다.
도구를 고를 때 확인할 점
- 생성 속도와 결과 품질 사이의 균형이 작업에 맞는가
- 원하는 해상도와 화풍을 안정적으로 내는가
- 생성물의 상업적 이용·저작권 조건이 명확한가
- 일부 영역만 다시 생성하는 인페인팅 등 편집 기능이 있는가
실제 적용 예시
마케팅 이미지를 만들 때, 확산 모델 기반 도구로 저단계 빠른 미리보기를 여러 장 뽑아 방향을 정한 뒤, 고른 시안만 고단계로 다시 생성해 품질을 높입니다. 생성 단계 수를 조절할 수 있는 도구라면 이런 속도·품질 절충을 직접 다룰 수 있습니다.
관련 용어
Stable Diffusion
Stability AI가 공개한 오픈소스 텍스트-이미지 생성 모델로, 잠재 확산 모델을 기반으로 합니다.
텍스트-이미지 생성텍스트 설명을 분석해 시각적 이미지로 변환하는 생성형 AI 기술입니다. 단순 이미지 생성을 넘어 디자인 시안, 마케팅 에셋 제작 등 실무 전반에 활용되며, 최근에는 이미지 내 문자(Typography) 표현력과 상업...
GAN생성자와 판별자가 경쟁하며 실사 같은 데이터를 생성하는 딥러닝 아키텍처입니다. 디퓨전 모델보다 생성 속도가 월등히 빨라 실시간 영상 변환, 고해상도 복원 등에 주로 활용됩니다.
생성형 AI대규모 데이터를 학습하여 데이터의 패턴과 구조를 이해하고, 이를 바탕으로 텍스트, 이미지, 오디오, 코드 등 독창적인 새로운 콘텐츠를 생성하는 인공지능 기술입니다.