Grobid란 무엇인가요?

Grobid는 머신러닝 기반의 학술 문헌 PDF 구조 분석 및 데이터 추출 라이브러리.

Grobid는 어떤 상황에서 사용하나요?

Grobid는 대규모 학술 검색 엔진 인덱싱 파이프라인 구축, RAG 시스템용 고품질 논문 데이터 전처리, 자동 인용 분석 및 서지 네트워크 구축 등의 상황에서 활용할 수 있습니다.

Grobid의 주요 기능은 무엇인가요?

Grobid의 핵심 기능으로는 SciBERT·BidLSTM 등 DeLFT 기반 딥러닝 모델 통합, 고성능 REST API 기반 대규모 병렬 처리 지원, Crossref·biblio-glutton 연동 서지 정보 자동 보정 등이 있습니다.

그로비드

Grobid

머신러닝 기반의 학술 문헌 PDF 구조 분석 및 데이터 추출 라이브러리

무료WebAPICLI오픈소스

웹사이트 방문하기github.com

검증된 사실

최신 버전: 0.9.0
GitHub: ★ 4,936
최근 변경: 2026-01-09 Python 클라이언트 v0.1.4 출시 — 안정성 개선. 소스: https://pypi.org/project/grobid-client-python/ 2025-11-19 Python 클라이언트 v

2026-06-20 직접 확인 · 자동 검증 데이터

제품 화면

2026-06-20 확인

가격 정보

무료시작 가격: Free (open source)

학술 문서 및 PDF 데이터 추출을 위한 오픈소스 머신러닝 라이브러리로, Apache 2.0 라이선스 하에 무료로 제공됩니다. 상업적 이용을 포함하여 모든 기능을 비용 없이 사용할 수 있으며, 사용자가 직접 서버를 구축하여 운영하는 방식입니다.

가격표 확인하기

최근 업데이트와 소식

버전 업데이트2026-01-09
Python 클라이언트 v0.1.4 출시 — 안정성 개선.
Python 클라이언트 v0.1.4 출시 — 안정성 개선.
버전 업데이트2025-11-19
Python 클라이언트 v0.1.2 출시.
Python 클라이언트 v0.1.2 출시.
버전 업데이트2025-10-31
Python 클라이언트 v0.1.0 정식 출시 — Crossref 연동 개선, ORCID 자동 수집 지원 추가.
Python 클라이언트 v0.1.0 정식 출시 — Crossref 연동 개선, ORCID 자동 수집 지원 추가.

소개AI 요약

Grobid는 학술 논문 PDF를 TEI/XML 형식의 구조화된 데이터로 변환하는 머신러닝 기반 오픈소스 라이브러리입니다. SciBERT 등 딥러닝 모델(DeLFT)을 통합하여 저자, 소속, 섹션, 인용 등을 고정밀로 추출하며, REST API와 Docker로 대규모 병렬 처리가 가능합니다. Semantic Scholar 등 주요 학술 플랫폼에서 실제 사용되고 있습니다.