리덕토

리덕토

Reducto

복잡한 레이아웃의 문서를 LLM이 즉시 처리 가능한 고정밀 데이터로 변환하는 AI 파서

부분 무료WebAPIDesktop오픈소스
웹사이트 방문하기reducto.ai
마인드 스튜디오와(과) 비교하기

소개

Reducto는 OCR과 비전-언어 모델(VLM)을 결합하여 복잡한 비정형 문서를 LLM 친화적인 데이터로 변환하는 차세대 문서 지능 API로, 최근 1억 달러 이상의 누적 투자 유치와 함께 10억 페이지 이상의 처리 실적을 달성했습니다.

활용 워크플로우

에이전틱 OCR 및 멀티 패스 분석전통적인 OCR과 차세대 비전-언어 모델(VLM)을 결합하여 오타와 구조적 오류를 스스로 교정하며 인간 수준의 문서 이해도를 제공합니다.
픽셀 레벨 차트 및 표 데이터 복원금융 제표나 기술 보고서의 복잡한 중첩 표와 선형/바 그래프를 픽셀 단위로 분석하여 LLM이 즉시 활용 가능한 고정밀 마크다운으로 변환합니다.
제로샷 스키마 기반 추출 (Extract API)AI 데이터 엔지니어가 정의한 JSON 스키마에 맞춰 비정형 문서에서 필요한 핵심 정보만을 별도의 학습 없이 즉시 구조화된 데이터로 추출합니다.
검증 가능한 인용 및 바운딩 박스추출된 모든 데이터에 대해 원본 문서 내 위치(Bounding Box)를 시각적으로 연결하여 RAG 시스템의 신뢰성과 감사 가능성을 확보합니다.
리덕토AI 허브
지능형 문서 편집 및 폼 자동 작성 (Edit API)단순 추출을 넘어 비어있는 양식(Form)을 지능적으로 채우거나 기존 문서의 내용을 수정하여 엔드 투 엔드 워크플로우를 자동화합니다.
웹-투-마크다운 및 URL 파싱PDF와 이미지뿐만 아니라 웹페이지 URL을 직접 입력받아 레이아웃과 이미지를 보존한 깨끗한 마크다운 데이터로 실시간 변환합니다.
엔터프라이즈급 배치 처리 및 보안초당 수십 건 이상의 쿼리 처리와 HIPAA/SOC2 인증을 바탕으로 의료 및 금융 분야의 대규모 민감 데이터를 안전하게 처리합니다.
에이전틱 OCR 및 멀티 패스 분석전통적인 OCR과 차세대 비전-언어 모델(VLM)을 결합하여 오타와 구조적 오류를 스스로 교정하며 인간 수준의 문서 이해도를 제공합니다.
픽셀 레벨 차트 및 표 데이터 복원금융 제표나 기술 보고서의 복잡한 중첩 표와 선형/바 그래프를 픽셀 단위로 분석하여 LLM이 즉시 활용 가능한 고정밀 마크다운으로 변환합니다.
제로샷 스키마 기반 추출 (Extract API)AI 데이터 엔지니어가 정의한 JSON 스키마에 맞춰 비정형 문서에서 필요한 핵심 정보만을 별도의 학습 없이 즉시 구조화된 데이터로 추출합니다.
검증 가능한 인용 및 바운딩 박스추출된 모든 데이터에 대해 원본 문서 내 위치(Bounding Box)를 시각적으로 연결하여 RAG 시스템의 신뢰성과 감사 가능성을 확보합니다.
리덕토AI 허브
지능형 문서 편집 및 폼 자동 작성 (Edit API)단순 추출을 넘어 비어있는 양식(Form)을 지능적으로 채우거나 기존 문서의 내용을 수정하여 엔드 투 엔드 워크플로우를 자동화합니다.
웹-투-마크다운 및 URL 파싱PDF와 이미지뿐만 아니라 웹페이지 URL을 직접 입력받아 레이아웃과 이미지를 보존한 깨끗한 마크다운 데이터로 실시간 변환합니다.
엔터프라이즈급 배치 처리 및 보안초당 수십 건 이상의 쿼리 처리와 HIPAA/SOC2 인증을 바탕으로 의료 및 금융 분야의 대규모 민감 데이터를 안전하게 처리합니다.
연동Python SDKREST APILangChainLlamaIndexAWS MarketplaceZapier

핵심 차별점: 인간처럼 문서를 시각적으로 이해하는 VLM 기술을 통해 복잡한 표와 차트를 완벽하게 구조화하여 AI 에이전트의 데이터 활용 능력을 극대화합니다.

주요 기능

  • 에이전틱 OCR 프레임워크
  • 고정밀 차트/그래프 데이터 추출
  • 스키마 기반 제로샷 데이터 추출 API
  • 지능형 문서 편집 및 폼 필링 API
  • AWS Marketplace 공식 지원

장점 & 단점

웹검색을 통해 수집된 사용자 피드백 정보입니다

장점

  • 다중 열 PDF, 재무 테이블, 차트, 불량 스캔물 등 복잡한 레이아웃에서 높은 정확도 제공
  • 지저분한 필기 이미지도 거의 완벽하게 인식하여 JSON으로 반환
  • 사람처럼 읽는 다중 패스 시스템으로 레이아웃·추출 오류 자체 교정
  • RAG와 벡터DB에 최적화된 고품질 마크다운·구조화 JSON 출력 지원
  • 테이블 헤더와 데이터를 함께 보존하는 청킹으로 RAG 환각 현상 감소
  • 문장 수준 바운딩 박스 제공으로 추출 데이터의 출처 검증 용이

단점

  • A4 페이지당 8~13초 처리 시간으로 실시간 애플리케이션에는 느린 편
  • 소규모 프로젝트엔 비용 부담 크고, 가격-연산량 연관성 파악 어려움
  • 개발자 콘솔 중심이라 비즈니스 사용자 접근에 기술적 지식 필요
  • 폐쇄형 플랫폼이라 어떤 LLM·OCR 엔진을 쓰는지 내부 확인 불가
  • human-in-the-loop 검증용 네이티브 문서 검토 인터페이스가 부족함

가격 정보

부분 무료시작 가격: 초기 15,000 크레딧 무료 제공 후 크레딧당 $0.015

무료 체험이 가능하며, 유료 플랜인 Standard 플랜은 월 $350부터 시작한다. 이 플랜에는 월 15,000페이지 처리가 포함되어 있으며, 초과 시 페이지당 $0.015의 비용이 발생한다. 대규모 처리를 위한 Growth 및 Enterprise 플랜은 별도 문의를 통해 제공된다.

가격표 확인하기

활용 사례

  • 금융 투자 플랫폼의 자동 문서 분석기 구축
  • 의료Prior Auth 워크플로우 자동화
  • 법률 문서의 고정밀 추출 및 교정
  • 대규모 RAG 파이프라인의 데이터 인제스천

대상 사용자

AI 개발팀기업

연동 서비스

Python SDKREST API

태그

문서 작성API데이터 분석클라우드개발자 도구

사용자 리뷰

리뷰를 불러오는 중...

대안 도구

이 도구 대신 사용할 수 있는 대안