
쿠베플로우
Kubeflow
Kubernetes에서 ML 파이프라인 전 과정을 관리하는 클라우드 네이티브 MLOps 플랫폼
검증된 사실
- GitHub
- ★ 15,654
- 최근 변경
- 2026-02-04 Kubeflow가 Metaflow와의 공식 통합을 발표하였으며, 개발자는 Metaflow로 작성된 워크플로우를 Kubeflow Pipelines에 직접 배포할 수 있게 되었습니다. 소스: http
2026-06-20 직접 확인 · 자동 검증 데이터
제품 화면

2026-06-20 확인
가격 정보
쿠버네티스 기반의 오픈 소스 프로젝트로 소프트웨어 자체는 무료입니다. 사용자가 직접 인프라를 구축하고 관리해야 하므로 서버, 스토리지 등 클라우드 리소스 비용이 주된 지출 요인이 됩니다. Arrikto나 Canonical 같은 파트너사를 통해 유료 관리형 서비스를 이용할 수도 있습니다.
최근 업데이트와 소식
- 버전 업데이트Kubeflow SDK v0.4.0 출시 — Model Registry·SparkConnect
Kubeflow SDK v0.4.0이 2026년 3월 출시됐습니다. SparkConnect 지원 SparkClient API, 멀티테넌트 격리를 위한 네임스페이스 TrainingRuntimes, Dataset·Model Initializer를 추가했고 최소 요구 사항을 Python 3.10으로 올렸습니다.
근거: Kubeflow 공식 블로그: 'Kubeflow SDK v0.4.0: Model Registry, SparkConnect, and Enhanced Developer Experience'
소개AI 요약
활용 워크플로우
입력
쿠베플로우
출력
LLM 파인튜닝 워크플로우
ML 엔지니어가 Training Operator를 통해 대규모 언어 모델을 분산 환경에서 특정 도메인 데이터로 미세 조정하는 경로
AutoML 최적화 워크플로우
데이터 과학자가 Katib을 사용하여 수백 개의 하이퍼파라미터 조합을 병렬로 테스트하고 최적의 모델을 찾는 경로
GitOps 기반 지속적 배포
플랫폼 팀이 Argo CD와 연동하여 파이프라인 변경 사항을 쿠버네티스 클러스터에 자동으로 반영하는 운영 경로
핵심 차별점: 쿠버네티스 네이티브 인프라를 활용하여 인프라 종속성 없이 ML 생애주기 전반을 확장 가능한 마이크로서비스 형태로 오케스트레이션하는 표준 MLOps 플랫폼입니다.
주요 기능AI 요약
- Kubeflow Pipelines — Kubernetes 기반 ML 파이프라인 빌드·배포·모니터링
- KFP SDK 2.x — Python으로 파이프라인 컴포넌트를 선언적으로 정의
- KServe 통합 — 모델 서빙 및 추론 엔드포인트 관리
- 1000+ 사용자 스케일링 — 네임스페이스당 제로 파드 오버헤드
- Jupyter 노트북 통합 — Intel Gaudi 가속기용 PyTorch 이미지 포함
활용 사례AI 요약
- Kubernetes 기반 ML 모델 학습 파이프라인 자동화
- 대규모 MLOps 플랫폼 구축 및 운영
- 다중 사용자 ML 실험 환경 관리
- 모델 서빙 및 A/B 테스트 인프라 구성
사용자 리뷰
리뷰를 불러오는 중...
대안 도구
이 도구 대신 사용할 수 있는 대안
라가스
Exploding Gradients
RAG 파이프라인과 LLM 앱의 품질을 충실도·관련성·정밀도 지표로 자동 평가하는 오픈소스 프레임워크
딥이밸
Confident AI
Pytest 스타일로 LLM 출력을 50개 이상 지표로 검증하고 프로덕션까지 모니터링하는 오픈소스 테스트 프레임워크
에이치투오 에이아이
AutoML과 생성형 AI를 결합해 기업 맞춤형 AI 모델을 빠르게 구축·배포하는 엔터프라이즈 AI 플랫폼
벤토ML
머신러닝 모델을 고성능 예측 서비스로 변환하고 관리하는 오픈 소스 MLOps 플랫폼
어라이즈 AI
ML 모델과 LLM 성능 모니터링, 문제 해결 및 에이전트 트레이싱을 위한 AI 관측성 플랫폼
오픈LL메트리
Traceloop
OpenTelemetry 기반 LLM 애플리케이션 트레이싱 및 모니터링 오픈소스 프레임워크