아파치 에어플로우

아파치 에어플로우

Apache Airflow

Python 기반의 워크플로우 작성, 예약 및 모니터링 업계 표준 오케스트레이션 도구

무료WebAPICLI오픈소스
웹사이트 방문하기airflow.apache.org

검증된 사실

GitHub
★ 45,510
최근 변경
2026-05-29 Apache Airflow 3.2.2가 출시되었습니다. 이전 버전에서 부분적으로 해결된 트리거러 컴포넌트 문제를 포함한 버그 수정 및 개선이 이루어졌습니다. 소스: https://pypi.org/

2026-06-20 직접 확인 · 자동 검증 데이터

제품 화면

아파치 에어플로우 제품 화면

2026-06-20 확인

가격 정보

무료시작 가격: 무료

오픈 소스 소프트웨어로 누구나 무료로 다운로드하여 사용할 수 있습니다. 별도의 유료 플랜은 없으나, 이를 직접 운영하기 위한 서버 인프라 비용이나 AWS MWAA, Astronomer와 같은 관리형 서비스를 이용할 경우 해당 서비스의 이용료가 발생합니다.

가격표 확인하기

최근 업데이트와 소식

  • 버전 업데이트
    Apache Airflow 3.2.0 출시 — Asset 파티셔닝·멀티팀 배포

    Apache Airflow 3.2.0이 출시됐습니다. 세분화된 파이프라인 오케스트레이션을 위한 Asset 파티셔닝, 엔터프라이즈 규모 멀티팀 배포, 동기식 데드라인 알림 콜백, Task SDK 분리 진전을 담았습니다.

    근거: Apache Airflow 공식 블로그: 'Apache Airflow 3.2.0: Data-Aware Workflows at Scale'

소개AI 요약

Apache Airflow는 Python 코드로 워크플로우를 작성·예약·모니터링하는 오픈소스 데이터 파이프라인 오케스트레이션 플랫폼입니다. 2025년 4월 Airflow 3.0이 출시된 이후 2026년 4월에는 3.2.0이 릴리스되어 자산 파티셔닝, 멀티팀 지원, UI 성능 대폭 향상 등의 신기능이 추가되었습니다.

활용 워크플로우

Python 기반 DAG 정의데이터 엔지니어가 복잡한 워크플로우 의존성을 파이썬 코드로 선언하여 형상 관리와 재사용성을 극대화합니다.
자산 기반 스케줄링 (Asset-Aware)단순 시간 설정이 아닌, 데이터셋(Asset)의 생성이나 업데이트 상태에 반응하여 후속 파이프라인을 자동으로 실행합니다.
이벤트 기반 트리거Kafka, AWS SQS 등 외부 메시지 큐의 이벤트를 실시간으로 감지하여 대기 시간 없는 데이터 처리를 구현합니다.
다중 언어 Task SDK워크플로우 구조는 Python으로 짜되, 실제 연산 로직은 Go나 Java 등 비즈니스 요구에 맞는 최적의 언어로 작성할 수 있습니다.
아파치 에어플로우AI 허브
DAG 버전 관리 및 롤백코드 변경 이력을 메타데이터 수준에서 추적하여, 오류 발생 시 즉각적으로 안전한 이전 버전의 워크플로우로 복구합니다.
현대적 React UI/UXFastAPI 기반의 고성능 대시보드를 통해 수천 개의 태스크 상태와 로그를 실시간으로 모니터링하고 시각화합니다.
Human-in-the-loop데이터 품질 검증이나 고비용 인프라 배포 전, 관리자의 수동 승인을 기다리는 일시 정지 구간을 설정할 수 있습니다.
Python 기반 DAG 정의데이터 엔지니어가 복잡한 워크플로우 의존성을 파이썬 코드로 선언하여 형상 관리와 재사용성을 극대화합니다.
자산 기반 스케줄링 (Asset-Aware)단순 시간 설정이 아닌, 데이터셋(Asset)의 생성이나 업데이트 상태에 반응하여 후속 파이프라인을 자동으로 실행합니다.
이벤트 기반 트리거Kafka, AWS SQS 등 외부 메시지 큐의 이벤트를 실시간으로 감지하여 대기 시간 없는 데이터 처리를 구현합니다.
다중 언어 Task SDK워크플로우 구조는 Python으로 짜되, 실제 연산 로직은 Go나 Java 등 비즈니스 요구에 맞는 최적의 언어로 작성할 수 있습니다.
아파치 에어플로우AI 허브
DAG 버전 관리 및 롤백코드 변경 이력을 메타데이터 수준에서 추적하여, 오류 발생 시 즉각적으로 안전한 이전 버전의 워크플로우로 복구합니다.
현대적 React UI/UXFastAPI 기반의 고성능 대시보드를 통해 수천 개의 태스크 상태와 로그를 실시간으로 모니터링하고 시각화합니다.
Human-in-the-loop데이터 품질 검증이나 고비용 인프라 배포 전, 관리자의 수동 승인을 기다리는 일시 정지 구간을 설정할 수 있습니다.
연동AWS (S3, Redshift, SQS)Google Cloud (BigQuery, GCS)Azure (Data Factory, Blob Storage)SnowflakedbtDatabricksApache KafkaKubernetes

핵심 차별점: 데이터 플랫폼 아키텍트가 데이터 자산의 생명주기를 완벽히 제어하고, 이벤트 반응형 아키텍처를 통해 AI/MLOps를 표준화할 수 있게 돕는 글로벌 표준 오케스트레이터입니다.

주요 기능AI 요약

  • Python 기반 DAG(방향성 비순환 그래프)로 워크플로우 코드화
  • 자산 기반(Asset-aware) 스케줄링 및 이벤트 드리븐 트리거
  • Task SDK를 통한 다중 언어 지원
  • React 기반 실시간 모니터링 대시보드 UI
  • Human-in-the-loop 워크플로우 지원
  • 기본 내장 DAG 버전 관리
  • 자산 파티셔닝(Asset Partitioning) 기반 다운스트림 스케줄링

활용 사례AI 요약

  • 데이터 수집·변환·적재(ETL) 파이프라인 자동화
  • 멀티 클라우드 환경의 AI 모델 학습 자동화
  • 이벤트 기반 실시간 데이터 파이프라인 운영
  • 관리자 승인이 포함된 인프라 프로비저닝 워크플로우

사용자 리뷰

리뷰를 불러오는 중...

대안 도구

이 도구 대신 사용할 수 있는 대안