
언스트럭처드
Unstructured
PDF·이미지·이메일 등 비정형 문서를 RAG 파이프라인용 구조화 데이터로 자동 변환하는 오픈소스 플랫폼
검증된 사실
- 최신 버전
- 0.23.12026-05-22
- 최근 변경
- 2026-06-11 Unstructured 라이브러리 버전 0.23.1이 PyPI에 공개되었으며, 비정형 문서 처리 파이프라인의 최신 패치가 적용되었습니다. 소스: https://pypi.org/project/uns
2026-06-20 직접 확인 · 자동 검증 데이터
제품 화면

2026-06-20 확인
가격 정보
오픈소스 라이브러리는 무료이며, SaaS API의 경우 15,000페이지까지 무료로 제공하는 프리 티어가 있습니다. 유료 플랜은 사용량 기반(Pay-as-you-go)으로 운영되며, Fast 파이프라인은 1,000페이지당 $1, Hi-Res 파이프라인은 1,000페이지당 $10가 부과됩니다. 기업용 엔터프라이즈 플랜은 별도 문의를 통해 맞춤형 가격으로 제공됩니다.
최근 업데이트와 소식
- 버전 업데이트Unstructured 라이브러리 버전 0.23.1이 PyPI에 공개되었으며, 비정형 문서 처리 파이프라인의 최신 패치가 적용되었습니다.
Unstructured 라이브러리 버전 0.23.1이 PyPI에 공개되었으며, 비정형 문서 처리 파이프라인의 최신 패치가 적용되었습니다.
- 버전 업데이트Unstructured 버전 0.22.31이 출시되어 청킹 옵션 명칭 isolate_tables를 isolate_table로 수정하는 버그 픽스가 포함되었습니다.
Unstructured 버전 0.22.31이 출시되어 청킹 옵션 명칭 isolate_tables를 isolate_table로 수정하는 버그 픽스가 포함되었습니다.
- 버전 업데이트최신 버전 0.22.30 PyPI 배포 — 토큰 기반 청킹 파라미터 추가, 이메일 MSG 첨부파일 경로 순회 보안 취약점 수정, PDF/이미지 파티셔닝 메모리 최...
최신 버전 0.22.30 PyPI 배포 — 토큰 기반 청킹 파라미터 추가, 이메일 MSG 첨부파일 경로 순회 보안 취약점 수정, PDF/이미지 파티셔닝 메모리 최적화.
소개AI 요약
활용 워크플로우
핵심 차별점: 문서의 시각적 문맥을 보존하며 모든 비정형 데이터를 LLM이 즉시 학습 가능한 'Element' 단위로 정교하게 분해하는 기술력
주요 기능AI 요약
- PDF·HTML·이미지·이메일 등 비정형 문서 자동 파티셔닝·정제
- RAG 파이프라인 전처리를 위한 LLM 준비 데이터 변환
- 토큰 기반 청킹(max_tokens·new_after_n_tokens 파라미터) 지원
- 오픈소스 라이브러리 + 클라우드 API 이중 제공 구조
- 복잡한 문서 레이아웃(표·수식·다단 컬럼) 자동 처리
- 경로 순회 보안 취약점 수정 등 지속적 보안 패치
활용 사례AI 요약
- RAG(검색 증강 생성) 파이프라인 데이터 전처리
- 기업 내부 문서 AI 검색 시스템 구축
- PDF·계약서·보고서 구조화 데이터 추출
- 이메일 아카이브 비정형 데이터 분석
- 멀티모달 문서 LLM 파인튜닝 데이터 준비
사용자 리뷰
리뷰를 불러오는 중...
대안 도구
이 도구 대신 사용할 수 있는 대안
팔란티르
방대한 데이터를 통합해 기업과 정부의 실질적인 의사결정을 지원하는 AI 운영 플랫폼
던 앤 브래드스트리트
전 세계 6억 개 이상의 기업 정보를 D-U-N-S 번호로 식별해 신용·공급망 리스크를 점검하는 B2B 데이터 플랫폼입니다. ChatD&B 같은 생성형 AI와 ChatGPT·Copilot·Claude 연동으로 데이터를 자연어와 워크플로에서 바로 끌어 씁니다.
데이터스트림즈
개인정보 규정을 준수하며 복잡한 데이터 수집과 전송 과정을 로우코드로 통합 관리하는 오케스트레이션 플랫폼
타블로 AI
자연어 질문으로 복잡한 시각화 대시보드를 생성하고 비즈니스 핵심 지표의 변화를 실시간으로 탐지하는 지능형 분석 도구
데이터브릭스
데이터 레이크와 웨어하우스를 통합해 기업용 AI 모델 개발부터 데이터 분석까지 원스톱으로 지원하는 플랫폼
세코다
데이터 카탈로그·계보·거버넌스를 AI로 통합 관리하며 자연어 질문으로 전사 데이터를 탐색하는 플랫폼 (Atlassian 인수)