
Docling
PDF 및 다양한 문서를 마크다운·JSON으로 변환하는 IBM의 경량 오픈소스 라이브러리
검증된 사실
- GitHub
- ★ 60,305
- 최근 변경
- 2026-06-12 Docling v2.102.1이 출시되어 서비스 모듈의 image_export_mode 기본값 버그가 수정되고, 사전 서명된 아티팩트를 통한 변환 결과 조회 기능이 추가되었습니다. 소스: http
2026-06-20 직접 확인 · 자동 검증 데이터
제품 화면

2026-06-20 확인
가격 정보
IBM에서 개발한 오픈소스 문서 파싱 도구로, Apache-2.0 라이선스에 따라 누구나 무료로 사용할 수 있습니다. 별도의 유료 구독 모델은 없으며, 로컬 환경이나 자체 서버에 설치하여 PDF, DOCX 등 다양한 문서를 마크다운이나 JSON 형식으로 변환할 수 있습니다.
최근 업데이트와 소식
- 소식Docling, 리눅스 재단 Agentic AI Foundation 기증·Red Hat OpenShift 오퍼레이터 출시
IBM이 2026년 초 Docling 프로젝트를 리눅스 재단 Agentic AI Foundation에 기증하고 Red Hat과 함께 은행권을 겨냥한 Docling OpenShift 오퍼레이터를 출시했습니다.
근거: [APPROX_DATE] SiliconANGLE(2026-02-24) 및 IDP-Software 보도에 따르면 IBM이 Docling을 AAIF에 기증하고 Red Hat OpenShift 오퍼레이터를 2026년 초 출시했으며 은행 부문이 주요 타깃입니다(정확 일자 미상, 월 단위).
- 버전 업데이트IBM, 단일 258M VLM 'Granite-Docling-258M' Apache 2.0 공개
IBM이 2026년 1월 실험판 SmolDocling을 대체하는 프로덕션급 단일 258M 비전언어모델 Granite-Docling-258M을 Apache 2.0으로 공개했다고 발표했습니다.
근거: [APPROX_DATE] IBM Research 발표에 따르면 2026년 1월 Granite-Docling-258M을 Apache 2.0으로 공개했습니다(정확 일자 미상, 월 단위).
소개AI 요약
활용 워크플로우
입력
Docling
출력
RAG 파이프라인 자동화
데이터 엔지니어가 LangChain 통합 기능을 사용하여 파싱된 데이터를 벡터 데이터베이스에 실시간으로 인덱싱
대규모 아카이브 구조화
스타트업 CTO가 CPU 최적화 로컬 모델을 활용하여 보안이 중요한 대량의 내부 문서를 오프라인에서 마이그레이션
사용자 정의 모델 튜닝
데이터 과학자가 특정 도메인 문서에 맞춰 OCR 엔진 스택이나 레이아웃 예측 임계값을 조정
핵심 차별점: IBM의 TableFormer 모델을 통해 복잡하게 병합된 표의 논리적 구조를 로컬 CPU 환경에서도 완벽하게 복원하는 기술적 우위
주요 기능AI 요약
활용 사례AI 요약
- 로컬 환경에서의 RAG 데이터 파이프라인 구축
- 대규모 문서 아카이브의 텍스트 구조화 및 색인
- 민감한 문서의 오프라인 파싱 및 처리
- LLM 학습용 고품질 텍스트 데이터 추출
사용자 리뷰
리뷰를 불러오는 중...
대안 도구
이 도구 대신 사용할 수 있는 대안
클로바 AI
Naver
한국어와 국내 맥락에 최적화된 하이퍼클로바 X로 AI 서비스를 개발·배포하는 통합 플랫폼
애스크코디
코드 생성부터 테스트, 문서화까지 개발 전 과정을 지원하는 멀티 모델 기반 AI 코딩 어시스턴트
컨티뉴
IDE 안에서 원하는 LLM을 선택해 코드 맥락을 제어하는 오픈소스 AI 코딩 어시스턴트
세레브라스
세계 최대 크기의 AI 전용 칩으로 기존 GPU보다 수십 배 빠른 초고속 LLM 추론 환경을 제공하는 API 플랫폼
블랙박스 AI
여러 AI 모델을 골라 쓰고 2억 개 이상의 저장소를 검색하며 실시간 자동완성까지 제공하는 AI 코딩 어시스턴트
그록
자체 LPU 칩으로 오픈소스 모델을 빠르게 돌리는 추론 전용 클라우드 플랫폼입니다. GPU 기반 서비스보다 초당 토큰 생성량이 높고 첫 응답까지의 지연이 짧은 점이 핵심입니다.