Docling이란 무엇인가요?

Docling은 PDF 및 다양한 문서를 마크다운·JSON으로 변환하는 IBM의 경량 오픈소스 라이브러리.

Docling은 어떤 상황에서 사용하나요?

Docling은 로컬 환경에서의 RAG 데이터 파이프라인 구축, 대규모 문서 아카이브의 텍스트 구조화 및 색인, 민감한 문서의 오프라인 파싱 및 처리 등의 상황에서 활용할 수 있습니다.

Docling의 주요 기능은 무엇인가요?

Docling의 핵심 기능으로는 PDF·DOCX·PPTX·HTML·이미지 등 다중 포맷 지원, TableFormer 기반 초정밀 표 구조 복원, LangChain·LlamaIndex 기본 커넥터 제공 등이 있습니다.

Docling

PDF 및 다양한 문서를 마크다운·JSON으로 변환하는 IBM의 경량 오픈소스 라이브러리

무료Python LibraryCLIDocker오픈소스

웹사이트 방문하기docling-project.github.io

검증된 사실

GitHub: ★ 60,305
최근 변경: 2026-06-12 Docling v2.102.1이 출시되어 서비스 모듈의 image_export_mode 기본값 버그가 수정되고, 사전 서명된 아티팩트를 통한 변환 결과 조회 기능이 추가되었습니다. 소스: http

2026-06-20 직접 확인 · 자동 검증 데이터

제품 화면

2026-06-20 확인

가격 정보

무료시작 가격: 무료

IBM에서 개발한 오픈소스 문서 파싱 도구로, Apache-2.0 라이선스에 따라 누구나 무료로 사용할 수 있습니다. 별도의 유료 구독 모델은 없으며, 로컬 환경이나 자체 서버에 설치하여 PDF, DOCX 등 다양한 문서를 마크다운이나 JSON 형식으로 변환할 수 있습니다.

가격표 확인하기

최근 업데이트와 소식

소식2026-02-15
Docling, 리눅스 재단 Agentic AI Foundation 기증·Red Hat OpenShift 오퍼레이터 출시
IBM이 2026년 초 Docling 프로젝트를 리눅스 재단 Agentic AI Foundation에 기증하고 Red Hat과 함께 은행권을 겨냥한 Docling OpenShift 오퍼레이터를 출시했습니다.
근거: [APPROX_DATE] SiliconANGLE(2026-02-24) 및 IDP-Software 보도에 따르면 IBM이 Docling을 AAIF에 기증하고 Red Hat OpenShift 오퍼레이터를 2026년 초 출시했으며 은행 부문이 주요 타깃입니다(정확 일자 미상, 월 단위).
버전 업데이트2026-01-15
IBM, 단일 258M VLM 'Granite-Docling-258M' Apache 2.0 공개
IBM이 2026년 1월 실험판 SmolDocling을 대체하는 프로덕션급 단일 258M 비전언어모델 Granite-Docling-258M을 Apache 2.0으로 공개했다고 발표했습니다.
근거: [APPROX_DATE] IBM Research 발표에 따르면 2026년 1월 Granite-Docling-258M을 Apache 2.0으로 공개했습니다(정확 일자 미상, 월 단위).

소개AI 요약

IBM Research에서 공개한 오픈소스 라이브러리로, PDF·DOCX·PPTX 등 다양한 문서 형식을 마크다운이나 JSON으로 신속하게 변환합니다. 2026년 5월 기준 최신 버전은 docling 2.95.0이며, MCP 서버 지원(docling-mcp v2.0)과 ONNX Runtime 기반 경량 추론이 추가되었습니다. AAAI 2025에 논문이 게재되며 학술적으로도 인정받았습니다.