쿠베플로우

쿠베플로우

Kubeflow

Kubernetes에서 ML 파이프라인 전 과정을 관리하는 클라우드 네이티브 MLOps 플랫폼

무료WebCLIAPI오픈소스
웹사이트 방문하기kubeflow.org

검증된 사실

GitHub
★ 15,654
최근 변경
2026-02-04 Kubeflow가 Metaflow와의 공식 통합을 발표하였으며, 개발자는 Metaflow로 작성된 워크플로우를 Kubeflow Pipelines에 직접 배포할 수 있게 되었습니다. 소스: http

2026-06-20 직접 확인 · 자동 검증 데이터

제품 화면

쿠베플로우 제품 화면

2026-06-20 확인

가격 정보

무료시작 가격: Free (open source)

쿠버네티스 기반의 오픈 소스 프로젝트로 소프트웨어 자체는 무료입니다. 사용자가 직접 인프라를 구축하고 관리해야 하므로 서버, 스토리지 등 클라우드 리소스 비용이 주된 지출 요인이 됩니다. Arrikto나 Canonical 같은 파트너사를 통해 유료 관리형 서비스를 이용할 수도 있습니다.

가격표 확인하기

최근 업데이트와 소식

  • 버전 업데이트
    Kubeflow SDK v0.4.0 출시 — Model Registry·SparkConnect

    Kubeflow SDK v0.4.0이 2026년 3월 출시됐습니다. SparkConnect 지원 SparkClient API, 멀티테넌트 격리를 위한 네임스페이스 TrainingRuntimes, Dataset·Model Initializer를 추가했고 최소 요구 사항을 Python 3.10으로 올렸습니다.

    근거: Kubeflow 공식 블로그: 'Kubeflow SDK v0.4.0: Model Registry, SparkConnect, and Enhanced Developer Experience'

소개AI 요약

Kubeflow는 Kubernetes에서 머신러닝 워크로드를 손쉽게 배포·실행·관리할 수 있도록 설계된 클라우드 네이티브 오픈소스 플랫폼입니다. ML 파이프라인, 노트북 서버, 모델 서빙, 실험 추적 등 ML 라이프사이클 전반을 단일 플랫폼에서 처리합니다. 2026년 최신 릴리스에서는 1000명 이상 사용자로의 대규모 확장성이 크게 개선되었습니다.

활용 워크플로우

입력

데이터 스토리지 (S3, GCS, NFS 등)ML 소스 코드 (GitHub, GitLab 저장소)컨테이너 이미지 (Docker Hub, Private Registry)실험 구성 YAML (Katib 하이퍼파라미터 정의)

쿠베플로우

KFP(Kubeflow Pipelines) 기반 DAG 워크플로우 오케스트레이션Katib을 활용한 자동 하이퍼파라미터 튜닝 및 AutoML 수행Training Operator 기반 분산 학습 및 LLM 파인튜닝 (TrainJob API)KServe를 이용한 고성능 모델 서빙 및 오토스케일링 제어

출력

최적화된 모델 아티팩트 (.onnx, .pt, .pb)Model Registry 내 버전 관리된 모델 및 메타데이터실시간 추론용 REST/gRPC API 엔드포인트재현 가능한 파이프라인 템플릿 및 실험 분석 보고서

LLM 파인튜닝 워크플로우

ML 엔지니어가 Training Operator를 통해 대규모 언어 모델을 분산 환경에서 특정 도메인 데이터로 미세 조정하는 경로

AutoML 최적화 워크플로우

데이터 과학자가 Katib을 사용하여 수백 개의 하이퍼파라미터 조합을 병렬로 테스트하고 최적의 모델을 찾는 경로

GitOps 기반 지속적 배포

플랫폼 팀이 Argo CD와 연동하여 파이프라인 변경 사항을 쿠버네티스 클러스터에 자동으로 반영하는 운영 경로

핵심 차별점: 쿠버네티스 네이티브 인프라를 활용하여 인프라 종속성 없이 ML 생애주기 전반을 확장 가능한 마이크로서비스 형태로 오케스트레이션하는 표준 MLOps 플랫폼입니다.

주요 기능AI 요약

  • Kubeflow Pipelines — Kubernetes 기반 ML 파이프라인 빌드·배포·모니터링
  • KFP SDK 2.x — Python으로 파이프라인 컴포넌트를 선언적으로 정의
  • KServe 통합 — 모델 서빙 및 추론 엔드포인트 관리
  • 1000+ 사용자 스케일링 — 네임스페이스당 제로 파드 오버헤드
  • Jupyter 노트북 통합 — Intel Gaudi 가속기용 PyTorch 이미지 포함

활용 사례AI 요약

  • Kubernetes 기반 ML 모델 학습 파이프라인 자동화
  • 대규모 MLOps 플랫폼 구축 및 운영
  • 다중 사용자 ML 실험 환경 관리
  • 모델 서빙 및 A/B 테스트 인프라 구성

사용자 리뷰

리뷰를 불러오는 중...

대안 도구

이 도구 대신 사용할 수 있는 대안