멀티모달
용어 이름 복사
AI 개념약 1분 읽기
텍스트, 이미지, 음성, 영상 등 여러 형태의 데이터를 함께 처리할 수 있는 AI 모델입니다.
다른 이름
Multimodal멀티모달 AI다중 모달
상세 설명
멀티모달(Multimodal) AI는 텍스트, 이미지, 오디오, 비디오 등 둘 이상의 서로 다른 데이터 형식(모달리티)을 동시에 이해하고 처리할 수 있는 인공지능 모델을 말합니다.
GPT-4V, Gemini, Claude 3 등 최신 AI 모델들은 이미지를 보고 설명하거나, 텍스트와 이미지를 결합한 질문에 답변하는 등 멀티모달 능력을 갖추고 있습니다. 이는 AI의 활용 범위를 크게 확장시키고 있으며, 더 자연스러운 인간-AI 상호작용을 가능하게 합니다.
관련 용어
LLM
대규모 텍스트 데이터를 학습하여 인간의 언어를 이해, 생성, 추론하는 인공 신경망 모델입니다. 트랜스포머 아키텍처를 기반으로 수조 개의 파라미터를 활용해 문맥을 파악하며, 텍스트 생성을 넘어 코딩, 데이터 분석, 복...
컴퓨터 비전컴퓨터가 이미지와 비디오를 이해하고 분석할 수 있게 하는 AI 기술 분야입니다.
GPTOpenAI가 개발한 생성형 사전 학습 트랜스포머 모델 시리즈로, 대규모 데이터를 바탕으로 텍스트, 이미지, 음성을 생성 및 이해하는 최첨단 멀티모달 언어 모델(LLM)의 표준입니다.
생성형 AI방대한 데이터를 학습하여 텍스트, 이미지, 비디오 등 새로운 창작물을 만들어내는 인공지능 기술입니다. 기존 데이터를 분류하거나 예측하는 수준을 넘어, 사용자의 요구(프롬프트)에 따라 맥락에 맞는 독창적인 결과물을 생...