AI 용어 사전
AI, 머신러닝, 데이터 사이언스 핵심 개념을 한국어로 쉽게 풀어놓았습니다.
106개 용어
AI 모델을 학습시킬 때 사용한 데이터의 통계적 특성과 실제 운영 단계에서 입력되는 데이터의 분포가 달라져 모델의 예측 성능이 저하되는 현상을 뜻합니다.
머신러닝 학습을 위해 데이터에 정답 태그를 붙이는 작업입니다.
대량의 데이터에서 숨겨진 패턴과 규칙을 발견하는 기술입니다.
데이터를 수집·처리·분석하여 의미 있는 인사이트를 도출하는 과정입니다.
AI 모델이 외부 데이터(SaaS, DB, 파일 등)에 실시간으로 접근하여 정보를 가져올 수 있도록 돕는 기술적 통로입니다.
다층 인공 신경망을 통해 데이터의 복잡한 비선형 관계를 학습하는 머신러닝의 한 분야입니다. 데이터에서 특징(Feature)을 스스로 추출하며 이미지 인식, 자연어 처리, 생성형 AI 등 고도의 인지 능력이 필요한 분야에서 핵심 기술로 사용됩니다.
실제 사용한 리소스(토큰 수, API 호출 횟수, 연산 시간 등)에 비례하여 비용을 지불하는 모델로, 초기 고정 비용 없이 필요한 만큼만 사용할 수 있는 과금 방식입니다.
대규모 데이터로 AI 모델의 기초 지식을 학습시키는 첫 번째 단계입니다.
외부 시스템과 격리된 안전한 가상 환경으로, AI가 생성한 코드를 안전하게 실행하여 보안 위협을 차단하거나 새로운 서비스를 법적·기술적 제약 없이 실험하는 독립된 테스트 공간입니다.
방대한 데이터를 학습하여 텍스트, 이미지, 비디오 등 새로운 창작물을 만들어내는 인공지능 기술입니다. 기존 데이터를 분류하거나 예측하는 수준을 넘어, 사용자의 요구(프롬프트)에 따라 맥락에 맞는 독창적인 결과물을 생성하여 인간의 창의적 업무를 보조하고 자동화합니다.
서버 관리 없이 코드를 실행할 수 있는 클라우드 컴퓨팅 실행 모델입니다.
AI 모델의 정밀도를 낮춰 크기를 줄이고 추론 속도를 높이는 경량화 기법입니다.
입력 데이터에서 중요한 부분에 가중치를 부여하여 집중하는 딥러닝 메커니즘입니다.
AI가 저해상도 이미지나 영상의 픽셀 데이터를 딥러닝 모델로 분석하여, 디테일을 정교하게 추론하고 고해상도 품질로 변환하는 기술입니다.
대규모 조직의 보안, 규정 준수 및 관리 효율성을 위해 설계된 최상위 서비스 등급입니다. 데이터 학습 제외 보장, SSO 연동, 정밀한 권한 제어와 전담 기술 지원을 제공하며 주로 개별 계약을 통해 도입됩니다.
데이터가 생성되는 지점(엣지)에서 연산을 즉시 처리하여 응답 속도를 높이고 데이터 전송 비용을 절감하는 분산 컴퓨팅 기술입니다.
조직 내 사용자에게 개별 권한을 부여하는 대신, 직무에 따른 '역할(Role)'을 정의하고 이에 맞춰 AI 모델, 데이터, 시스템 기능에 대한 접근 권한을 체계적으로 제어하는 보안 관리 방식입니다.
AI 모델의 핵심 수치인 가중치(Parameters)를 공개하여, 사용자가 외부 API 없이 자신의 서버나 로컬 환경에 직접 설치하고 구동할 수 있게 하는 모델 배포 방식입니다.
소스 코드가 공개되어 누구나 자유롭게 사용, 수정, 배포할 수 있는 소프트웨어 방식입니다. AI 분야에서는 모델의 가중치(Weights)와 학습 코드를 공개하여 사용자가 직접 서버를 구축하거나 특정 목적에 맞춰 파인튜닝할 수 있는 개방형 기술 생태계를 의미합니다.
기업이 자체 데이터센터나 물리적 서버실에 하드웨어를 직접 설치·운영하는 방식입니다. 데이터 주권과 보안이 중요한 금융·공공 분야의 필수 모델이며, 최근에는 민감한 내부 데이터를 활용한 '프라이빗 AI'와 오픈소스 LLM의 로컬 추론 수요가 늘어나며 핵심 인프라로 다시 주목받고 있습니다.
방대한 양의 정보를 핵심 내용 중심으로 압축하여 정보 습득 효율을 높이는 자연어 처리(NLP) 기술입니다.
키워드 매칭이 아닌 의미를 이해하여 관련 결과를 찾는 검색 기술입니다.
AI가 텍스트 설명이나 참조 이미지로 새로운 이미지를 생성하는 기술입니다.
텍스트, 이미지 등의 데이터를 의미를 보존하는 고차원 수치 벡터로 변환한 것입니다.
사람의 개입을 최소화하여 정해진 규칙이나 학습된 로직에 따라 업무를 처리하는 기술입니다. 단순 반복 작업을 넘어 AI와 결합하여 스스로 판단하고 실행하는 지능형 자동화(Intelligent Automation)로 진화하고 있습니다.
한 작업에서 학습한 지식을 다른 관련 작업에 활용하는 머신러닝 기법입니다.
AI가 실시간으로 정보를 찾아 답변의 근거로 활용할 수 있도록, 기업의 내부 데이터를 검색 및 추론이 가능한 구조로 저장한 동적 데이터 저장소입니다.
AI 모델이 한 번에 처리할 수 있는 입력 텍스트의 최대 길이입니다.
컴퓨터가 이미지와 비디오를 이해하고 분석할 수 있게 하는 AI 기술 분야입니다.
AI가 자연어 지시로 프로그래밍 코드를 자동 생성하는 기술입니다.
AI 시스템이 비활성 상태에서 가동될 때 발생하는 응답 지연 시간, 또는 추천 시스템에서 데이터 부족으로 신규 사용자에게 정확한 결과를 제공하지 못하는 현상을 뜻합니다.
컨테이너화된 애플리케이션을 자동 관리하는 오케스트레이션 플랫폼입니다.
웹페이지의 정보를 자동으로 수집하는 기술입니다.
인터넷을 통해 컴퓨팅 자원을 온디맨드로 제공하는 IT 모델입니다. AI 분야에서는 고가의 GPU 하드웨어 구축 없이도 대규모 모델 학습과 추론에 필요한 고성능 연산 자원을 유연하게 확장하고, 최신 AI 모델을 API 형태로 즉시 활용할 수 있는 핵심 기반이 됩니다.
대규모 언어 모델(LLM)이 문맥을 파악하여 인간처럼 자연스러운 텍스트를 자동 생성하는 기술입니다. 단순히 문장을 완성하는 수준을 넘어, 복합적인 지시를 수행하거나 창의적인 콘텐츠 및 코드를 작성할 수 있습니다.
텍스트 설명을 입력하면 해당 내용의 이미지를 자동으로 생성하는 AI 기술입니다.
LLM이 텍스트를 인식하고 생성하는 기본 단위로, 문장을 단어·글자보다 작은 의미 조각으로 나눈 것입니다. AI 모델의 연산 비용, 응답 속도, 한 번에 기억할 수 있는 정보량(컨텍스트 윈도우)을 결정하는 핵심 지표입니다.
자연어 처리의 혁명을 이끈 딥러닝 아키텍처로, 셀프 어텐션 메커니즘을 핵심으로 합니다.
AI 모델이 학습 과정에서 조정하는 내부 변수로, 모델의 크기와 성능을 결정합니다.
데이터의 수집, 가공, 모델 학습, 배포에 이르는 일련의 처리 과정을 자동화된 흐름으로 연결한 시스템입니다. 데이터 정합성 유지와 재현 가능한 실험 환경 구축을 통해 운영 효율성을 극대화합니다.
사전 학습된 AI 모델을 특정 작업이나 도메인에 맞게 추가 학습시키는 과정입니다.
AI 모델에서 원하는 결과를 얻기 위해 입력 프롬프트를 설계하고 최적화하는 기술입니다.
두 가지 버전을 비교하여 더 효과적인 것을 찾는 실험 방법입니다.
인간 수준의 일반적 지능을 갖춘 인공지능을 의미합니다.
자율적으로 목표를 설정하고, 도구(API, 웹 등)를 사용해 복잡한 과업을 수행하는 지능형 시스템입니다. 단순히 답변을 생성하는 수준을 넘어 추론(Reasoning), 계획(Planning), 실행(Execution)의 루프를 반복하며 스스로 문제를 해결합니다.
소프트웨어 간 데이터와 기능을 교환하기 위한 표준 인터페이스입니다. AI 분야에서는 클라우드에 구축된 대규모 언어 모델(LLM)을 외부 앱에 연동하여 텍스트 생성, 이미지 분석 등의 기능을 즉시 구현하는 핵심 도구로 쓰입니다.
구독 기반 비즈니스의 연간 반복 매출로, SaaS 기업의 핵심 성장 지표입니다.
AI가 단계별로 추론 과정을 거치도록 유도하여 복잡한 문제를 해결하는 프롬프팅 기법입니다.
소프트웨어 변경 사항을 지속적으로 통합(CI)하고, 자동화된 검증을 거쳐 실서비스에 즉시 배포(CD)하는 개발 자동화 체계입니다. 오류를 조기에 발견하고 배포 주기를 단축하여 품질과 속도를 동시에 확보하는 현대 개발의 필수 방법론입니다.
이미지 인식에 특화된 딥러닝 신경망 구조입니다.
기업이 고객 데이터를 통합 관리하여 관계를 강화하고 수익을 극대화하는 전략적 시스템입니다. 최근 CRM은 단순한 데이터 기록을 넘어 AI를 통해 고객의 의도를 예측하고, 마케팅·영업·서비스 전 과정을 자동화하는 지능형 플랫폼으로 진화하여 초개인화된 고객 경험을 제공하는 데 핵심적인 역할을 합니다.
LLM 기반 애플리케이션 개발을 위한 오픈소스 프레임워크입니다.
대규모 텍스트 데이터를 학습하여 인간의 언어를 이해, 생성, 추론하는 인공 신경망 모델입니다. 트랜스포머 아키텍처를 기반으로 수조 개의 파라미터를 활용해 문맥을 파악하며, 텍스트 생성을 넘어 코딩, 데이터 분석, 복잡한 문제 해결 등 광범위한 지적 작업을 수행하는 생성형 AI의 핵심 엔진입니다.
대규모 모델을 효율적으로 파인튜닝하기 위해 저랭크 행렬을 추가하는 경량화 기법입니다.
RAG(검색 증강 생성)는 AI 모델이 외부 데이터베이스에서 관련 정보를 실시간으로 검색한 뒤, 이를 바탕으로 답변을 생성하는 기술입니다. 모델의 학습 데이터에 없는 최신 정보나 기업 내부 문서를 활용해 답변의 정확도를 높이고 AI의 환각(Hallucination) 현상을 획기적으로 줄여줍니다.
HTTP를 기반으로 리소스를 다루는 웹 API 설계 아키텍처 스타일입니다.
인간 평가자의 피드백을 활용하여 AI 모델을 정렬하는 학습 기법입니다.
순차적 데이터 처리에 특화된 딥러닝 신경망입니다.
투자 대비 수익의 비율을 나타내는 핵심 성과 지표입니다.
반복적인 업무를 소프트웨어 로봇으로 자동화하는 기술입니다.
클라우드를 통해 소프트웨어를 구독 형태로 제공하는 서비스 모델입니다.
특정 플랫폼용 소프트웨어를 개발하기 위한 도구, 라이브러리, 문서의 모음입니다.
웹사이트를 검색 엔진 결과에서 상위에 노출시키는 최적화 기술입니다.
한 번의 로그인으로 여러 서비스에 접근할 수 있게 하는 인증 방식입니다.
텍스트 설명으로부터 고품질 이미지를 생성하는 오픈소스 AI 모델입니다.
음성 신호를 컴퓨터가 이해할 수 있는 텍스트 데이터로 변환하는 AI 기술입니다. 최근에는 Whisper, Gemini 등 딥러닝 모델을 통해 소음 환경에서도 높은 정확도를 제공하며 자동 자막, 회의록 작성 등에 활용됩니다.