엣지 컴퓨팅
용어 이름 복사
인프라약 1분 읽기
데이터가 생성되는 지점(엣지)에서 연산을 즉시 처리하여 응답 속도를 높이고 데이터 전송 비용을 절감하는 분산 컴퓨팅 기술입니다.
다른 이름
Edge Computing엣지
상세 설명
엣지 컴퓨팅은 중앙 데이터 센터나 클라우드에 의존하지 않고, 스마트폰, IoT 센서, 자율주행 차량 등 데이터가 발생하는 현장에서 직접 데이터를 처리하는 방식입니다. AI 분야에서는 이를 '온디바이스 AI' 또는 '엣지 AI'로 확장하여 활용합니다. 네트워크 지연(Latency)을 최소화하여 실시간 추론이 가능하며, 민감한 데이터를 외부로 전송하지 않아 프라이버시 보호에 유리합니다. 최근에는 NPU(신경망 처리 장치)의 보급과 모델 경량화 기술의 발전으로 고성능 거대 언어 모델(LLM)을 기기 로컬에서 실행하는 단계로 진화하고 있습니다.
도구 선택에서 중요한 이유
실시간 응답이 필수적인 서비스(자율주행, 제조 공정 모니터링)나 개인정보보호가 최우선인 의료/금융 AI 도구를 선택할 때 엣지 컴퓨팅 지원 여부는 핵심 지표입니다. 클라우드 비용을 절감하면서도 오프라인 환경에서 안정적인 작동을 보장해야 하는 비즈니스 모델에 필수적입니다.
확인할 점
- 대상 기기의 하드웨어 가속기(NPU, GPU) 최적화 지원 여부
- 모델 경량화(양자화) 시 정확도 손실 허용 범위
- 인터넷 연결이 끊긴 상태에서의 로컬 작동 안정성
- 엣지 노드와 중앙 클라우드 간의 데이터 동기화 및 관리 정책
예시
자율주행 자동차는 주변 사물을 식별하기 위해 수 밀리초(ms) 내에 판단을 내려야 합니다. 데이터를 클라우드로 보내고 응답을 기다리는 대신, 차량 내 탑재된 전용 AI 칩에서 즉시 추론을 수행하는 것이 엣지 컴퓨팅의 대표적인 사례입니다.
헷갈리기 쉬운 용어
클라우드 컴퓨팅
중앙 집중식 서버에서 대규모 자원을 활용해 복잡한 학습이나 대량의 연산을 처리합니다.
온디바이스 AI
엣지 컴퓨팅의 한 형태이며, 특히 사용자 단말기(폰, PC 등) 내에서 AI 모델을 직접 구동하는 것에 초점을 맞춥니다.
관련 용어
온디바이스 AI (On-device AI)
클라우드 서버를 거치지 않고 스마트폰, PC 등 사용자 기기 내부의 하드웨어(NPU)를 통해 AI 모델을 직접 구동하여 보안성과 실시간성을 높이는 데 도움을 주는 방식한 기술입니다.
NPU딥러닝의 핵심인 대규모 행렬 연산을 하드웨어 수준에서 가속하여, 낮은 전력으로 온디바이스 AI 성능을 높이는 데 도움을 주는 방식하는 인공지능 전용 프로세서입니다.
cloud-computing레이턴시 (Latency)사용자가 AI에 요청을 보낸 시점부터 첫 응답이 화면에 나타나거나 전체 결과가 완료될 때까지 걸리는 소요 시간입니다.
양자화AI 모델의 정밀도를 낮춰 크기를 줄이고 추론 속도를 높이는 경량화 기법입니다.