
라이틀리
Lightly
방대한 원시 데이터에서 학습에 필요한 핵심 데이터만 골라 라벨링 비용을 절감하는 컴퓨터 비전 플랫폼
검증된 사실
- 라이브 가격
- Free · 무료2026-06-15 확인
- GitHub
- ★ 3,677
- 최근 변경
- 2026-05-28 LightlyTrain v0.15.1이 출시되어 LeJEPA 자기지도학습 방식 지원이 추가되었습니다. 소스: https://pypi.org/project/lightly-train/ 2026-05-
2026-06-15 직접 확인 · 자동 검증 데이터
제품 화면

2026-06-15 확인
가격 정보
머신러닝 데이터 큐레이션 도구로, 소규모 프로젝트를 위한 무료 플랜을 제공합니다. 유료 플랜은 월 $280부터 시작하며, 데이터 규모와 기능에 따라 가격이 달라집니다. LightlyStudio는 Apache-2.0 라이선스 오픈소스로 무료 사용 가능합니다.
최근 업데이트와 소식
- 투자Lightly, 300만 달러 시드 유치 — LightlyStudio 출시
ML 데이터 큐레이션 기업 Lightly가 2026년 1월 300만 달러 시드를 유치했습니다. 큐레이션·라벨링·임베딩을 하나로 통합한 LightlyStudio 플랫폼도 함께 선보였습니다.
근거: [APPROX_DATE] Lightly Newsroom/Extruct: 'Lightly secured a $3.0M Seed round in January 2026 ... LightlyStudio' (정확 일자 미상)
소개AI 요약
활용 워크플로우
입력
라이틀리
출력
Smart Capture 엣지 워크플로우
Lightly Worker를 현장 기기에 설치하여 대역폭 절감을 위해 중요한 프레임만 클라우드로 전송
액티브 러닝 피드백 루프
기존 모델의 추론 결과를 분석하여 모델이 학습하지 못한 취약 시나리오 데이터만 정밀 선별
3D LiDAR 데이터 큐레이션
2D 이미지를 넘어 3D Point Cloud 데이터의 공간적 다양성을 분석하여 자율주행 학습 데이터 최적화
핵심 차별점: 방대한 비정형 데이터에서 자기 지도 학습과 Coreset 기술을 결합해 모델 성능을 극대화할 핵심 데이터 1%를 정확히 골라내는 데이터 중심 AI(Data-Centric AI) 엔진
주요 기능AI 요약
- 자기 지도 학습 기반 사전 학습으로 라벨 없는 데이터 활용
- Coreset 알고리즘 기반 데이터 다양성 자동 선별
- LightlyStudio: 오픈소스 데이터 큐레이션·라벨링·임베딩 통합 플랫폼
- DuckDB·Rust 백엔드로 대용량 데이터셋 즉각 인터랙션
- Active Learning 루프로 최적 라벨링 대상 추천
- ISO 27001 인증 및 GDPR 준수 보안
장점 & 단점AI 분석
공식 정보와 공개 피드백을 함께 정리한 참고 메모입니다
장점
- 데이터 큐레이션 자동화로 라벨링할 데이터 선별 시간을 크게 절약
- 수백만 장의 이미지나 수천 개의 동영상을 신속하게 처리 가능
- 코딩 전문가가 아니어도 재사용 가능한 예시로 직관적으로 사용 가능
- 액티브 러닝 기능으로 라벨링 시간과 노력을 크게 절감
- 최상의 1% 데이터만 라벨링하여 동일 비용으로 모델 정확도 향상
- PyTorch, TensorFlow 등 ML 프레임워크와 통합으로 워크플로우 간소화
단점
- 고급 기능은 신규 사용자에게 학습 곡선이 가파를 수 있음
- 다른 도구와 동기화 시 오류와 중복 발생 가능, 데이터 전송 단계가 많음
- 모든 도구와 완벽하게 동기화되지 않아 데이터 중복이 완전히 제거되지 않음
- 스토리지 솔루션이 아닌 큐레이션 도구로서 스토리지 기능은 한계가 있음
- 튜토리얼 문서에 시각적 자료가 부족해 신규 사용자 적응에 어려움
- 필터링되지 않은 데이터 라벨링 시 예상과 다른 결과가 나올 수 있음
활용 사례AI 요약
- 자율주행 고도화를 위한 데이터 선별 및 중복 제거
- 의료 영상 진단 모델의 데이터 효율 최적화
- 제조 공정 결함 탐지 엣지 필터링
- 드론·로보틱스 비전 모델 학습 데이터 큐레이션
- 대규모 비라벨 데이터셋의 능동 학습 루프 자동화
사용자 리뷰
리뷰를 불러오는 중...
대안 도구
이 도구 대신 사용할 수 있는 대안
허깅페이스
Hugging Face, Inc.
200만 개 이상의 모델과 50만 개 데이터셋을 한곳에 모아두고, Spaces로 데모를 띄우고 Inference API로 추론까지 연결하는 오픈소스 머신러닝 플랫폼
아이닥
의료 영상의 이상 징후를 실시간 탐지하여 응급 환자의 판독 우선순위를 정하고 의료진 협업을 돕는 AI 플랫폼
사이킷런
데이터 전처리부터 다양한 머신러닝 알고리즘 구현까지 직관적인 인터페이스로 지원하는 파이썬 라이브러리
큐벤투스
AI가 수술실 일정과 병상 관리를 자동화하여 병원 운영 효율과 수익성을 극대화하는 플랫폼
비즈AI
CT/MRI 영상 AI 분석으로 뇌졸중·뇌출혈 환자를 즉시 식별하고 치료팀에 자동 알림하는 케어 코디네이션 플랫폼
데이터로봇
기업의 예측 및 생성형 AI 모델 구축부터 배포, 관리까지 전 과정을 자동화하는 통합 엔터프라이즈 플랫폼