파라미터
용어 이름 복사
데이터약 1분 읽기
AI 모델이 학습 과정에서 조정하는 내부 변수로, 모델의 크기와 성능을 결정합니다.
다른 이름
Parameter매개변수가중치
상세 설명
파라미터(Parameter)는 신경망 모델의 학습 가능한 내부 변수(가중치와 편향)를 말합니다. 모델의 "크기"를 나타내는 지표로 자주 사용되며, 파라미터가 많을수록 더 복잡한 패턴을 학습할 수 있습니다.
GPT-3는 1,750억 개, GPT-4는 수조 개(추정)의 파라미터를 가집니다. "7B", "13B", "70B" 등으로 표기되며(B = Billion = 10억), 더 많은 파라미터는 일반적으로 더 높은 성능을 의미하지만 비례 관계는 아닙니다.
관련 용어
LLM
대규모 텍스트 데이터를 학습하여 인간의 언어를 이해, 생성, 추론하는 인공 신경망 모델입니다. 트랜스포머 아키텍처를 기반으로 수조 개의 파라미터를 활용해 문맥을 파악하며, 텍스트 생성을 넘어 코딩, 데이터 분석, 복...
딥러닝다층 인공 신경망을 통해 데이터의 복잡한 비선형 관계를 학습하는 머신러닝의 한 분야입니다. 데이터에서 특징(Feature)을 스스로 추출하며 이미지 인식, 자연어 처리, 생성형 AI 등 고도의 인지 능력이 필요한 분...
파인튜닝사전 학습된 AI 모델을 특정 작업이나 도메인에 맞게 추가 학습시키는 과정입니다.