아티나 AI

아티나 AI

Athina AI

LLM 앱의 프롬프트 개발부터 자동화된 평가, 실시간 모니터링까지 지원하는 협업형 AI 운영 플랫폼

부분 무료CLIDesktopAPI오픈소스LLM 기반멀티모달
웹사이트 방문하기athina.ai
데이터로봇와(과) 비교하기

소개

Athina는 프로덕션 수준의 AI 기능을 구축하는 제품 팀을 위한 엔드투엔드 플랫폼입니다. 1. 프로토타입: 동적 열을 사용하면 LLM 프롬프트 실행, 코드 실행, API 호출 수행, 데이터 검색, 변환 실행 등을 수행할 수 있습니다(스프레드시트 UI에서). 2. 평가: 시트 자체 내에서 평가를 실행합니다. 50개 이상의 미리 설정된 평가 지표가 있거나 고유한 사용자 정의 평가(코드 없음)를 생성할 수 있습니다. 3. 실험: 단 몇 번의 클릭만으로 프롬프트, 모델, 검색기 또는 체인을 변경하세요. 기술 사용자는 프로그래밍 방식으로 더 많은 실험을 실행할 수 있습니다. 4. 비교: Diff 보기를 사용하여 여러 데이터 세트를 나란히 비교하고 모든 데이터에 대해 동시에 평가를 실행합니다. 5. 관찰 가능성: 지속적인 평가 및 세분화된 분석을 통해 프로덕션에서 LLM 기능을 모니터링합니다. Athina는 기술 사용자뿐만 아니라 비기술 사용자도 사용할 수 있습니다. 이는 PM, QA, 데이터 과학자, 엔지니어가 협력하여 훌륭한 AI 제품을 구축할 수 있음을 의미합니다.

활용 워크플로우

입력

프로덕션 환경 LLM API 로그 및 추적 데이터RAG 지식 기반 데이터 및 컨텍스트 문서프롬프트 템플릿 및 모델 구성 파라미터사용자 피드백 및 골든 데이터셋(CSV/JSON)

아티나 AI

Athina IDE 기반 스프레드시트형 노코드 프롬프트 실험 및 반복50개 이상의 자동화된 메트릭(환각 탐지, 신뢰도, 정답 유사성) 평가 실행모델 버전 간 병렬 비교(Side-by-side) 및 Diff 분석프로덕션 데이터에 대한 지속적인 모니터링 및 실시간 가드레일 적용

출력

정량화된 LLM 성능 벤치마크 및 스코어카드최적화된 프롬프트 버전 및 모델 설정값실시간 이상 징후 및 환각 발생 경고 리포트파인튜닝 및 리그레션 테스트를 위한 정제된 데이터셋

RAG 검증 워크플로우

검색된 컨텍스트와 생성된 답변 사이의 관련성(Relevance) 및 충실도(Faithfulness)를 검증하여 환각 현상 차단

비즈니스 협업 실험

제품 관리자(PM)와 도메인 전문가가 코드 없이 UI에서 직접 프롬프트를 수정하고 성능 변화를 즉시 확인

자동화된 회귀 테스트

CI/CD 파이프라인과 연동하여 새로운 모델 배포 전 기존 성능 대비 하락 여부를 자동으로 체크

핵심 차별점: 스프레드시트 UI를 통한 직관적인 실험 환경과 50개 이상의 정밀한 평가 메트릭을 결합하여 프로토타입부터 실제 운영까지의 LLM 신뢰성 사이클을 통합 관리합니다.

주요 기능

  • Athina IDE (스프레드시트 기반 실험)
  • 50+ 사전 설정 평가 메트릭
  • RAG 전용 평가(Faithfulness, Context Adherence)
  • 실시간 프로덕션 모니터링 및 가드레일
  • 고급 데이터셋 큐레이션

장점 & 단점

웹검색을 통해 수집된 사용자 피드백 정보입니다

장점

  • 기술 및 비기술 사용자 모두를 위한 협업 기능 지원
  • AI 프로토타이핑, 실험, 평가 및 모니터링을 위한 포괄적인 도구 제공
  • 스프레드시트와 유사한 인터페이스로 사용 편의성 증대
  • 50개 이상의 사전 설정된 평가 지표 및 사용자 정의 평가 기능 제공
  • 데이터 프라이버시 및 보안을 위한 자체 호스팅 배포 옵션 제공
  • AI 프로덕션 프로세스에 대한 완전한 가시성을 제공하는 강력한 모니터링 도구

단점

  • 초보 사용자를 위한 학습 곡선이 존재할 수 있음
  • Pro 및 Enterprise 요금제의 가격 투명성이 부족함
  • 기술 전문성이 부족한 팀에게는 복잡한 모델 관리가 어려울 수 있음
  • 풍부한 기능으로 인해 인터페이스가 다소 복잡하게 느껴질 수 있음
  • 고급 기능을 완전히 활용하기 위해 문서 참조가 필요할 수 있음

가격 정보

부분 무료시작 가격: $0 (Free tier available, Pro plans starting at $150/mo)

개발자를 위한 Starter 플랜을 무료로 제공하며, 월 10,000건의 로그 기록과 기본 분석 기능을 포함한다. Pro 플랜은 무제한 로그 및 평가 기능을 제공하며 가격은 데모 예약을 통해 개별 문의해야 한다. 엔터프라이즈 플랜은 셀프 호스팅 및 고급 보안 기능을 지원한다.

가격표 확인하기

활용 사례

  • LLM 응답의 환각(Hallucination) 현상을 탐지하고 정확도를 평가할 때
  • 프로덕션 환경에서 AI 모델의 성능을 실시간으로 모니터링할 때
  • 프롬프트 변경에 따른 성능 변화를 회귀 테스트할 때
  • AI 모델의 비용 및 토큰 사용량을 추적하고 최적화할 때
  • 대규모 데이터 세트를 활용해 AI 모델을 튜닝하거나 테스트할 때

대상 사용자

AI 엔지니어LLM 개발자데이터 과학자프로덕트 팀

연동 서비스

OpenAIClaudeLangChainAWSAzure

태그

API개발자 도구엔터프라이즈클라우드자동화RAG

사용자 리뷰

리뷰를 불러오는 중...

대안 도구

이 도구 대신 사용할 수 있는 대안