앤든 랩스

앤든 랩스

Andon Labs

AI 에이전트를 실제 환경에 배포해 안전성을 벤치마킹하고 자율 조직 구축 프로토콜을 개발하는 AI 안전 연구 스타트업

가격 문의desktopapiLLM 기반
웹사이트 방문하기andonlabs.com

검증된 사실

최근 변경
2026-05-18 Andon Labs가 Claude, ChatGPT, Gemini, Grok 4개 모델에 각각 20달러 예산을 부여하고 라디오 방송 운영을 맡기는 실험을 진행하였으며, 모든 AI 에이전트가 안정적인

2026-06-20 직접 확인 · 자동 검증 데이터

제품 화면

앤든 랩스 제품 화면

2026-06-20 확인

가격 정보

가격 문의시작 가격: 가격 문의

자율 운영 조직 및 AI 안전 벤치마킹을 연구하는 플랫폼으로, 일반 사용자를 위한 구독 요금제는 공개되어 있지 않습니다. 서비스 이용이나 협업을 위해서는 공식 이메일을 통해 직접 문의해야 합니다.

가격표 확인하기

최근 업데이트와 소식

소개AI 요약

Andon Labs는 인간의 개입 없이도 안전하게 운영되는 '안전 자율 조직(SAO)'을 구축하는 AI 안전 스타트업입니다. Vending-Bench를 통해 AI 에이전트의 장기 비즈니스 의사결정 능력을 벤치마킹하고, Project Vend(무인 자판기)·Andon FM(AI 라디오) 등 실전 프로젝트를 통해 실제 환경에서의 안전 프로토콜을 개발합니다. Anthropic과의 협업으로 Claude 기반 자율 에이전트를 실제 배포·검증합니다.

활용 워크플로우

연동SlackAnthropic Claude APIOpenAI GPT APIGoogle DeepMind Gemini APIxAI Grok APICustom Robotic Interfaces

핵심 차별점: 인간의 감시가 불가능한 미래의 AI 운영 환경에 대비하여, 실제 환경에서 검증된 '안전 자율 조직(SAO)' 구축과 실시간 병렬 감시 솔루션을 제공함.

주요 기능AI 요약

  • Vending-Bench: AI 장기 비즈니스 운영 성능 벤치마킹
  • Butter-Bench: 실환경 로봇 제어 성능 평가
  • 실시간 병렬 감시 에이전트(Oversight Agents)
  • 자율 조직(SAO) 배포 프레임워크
  • Project Vend: AI 운영 무인 자판기 실증
  • Andon FM: AI 기반 라디오 스테이션 운영

장점 & 단점AI 분석

공식 정보와 공개 피드백을 함께 정리한 참고 메모입니다

장점

  • AI 자율성 테스트를 위한 공개 플랫폼 제공
  • 연구 결과 및 코드 공개로 커뮤니티 기여 유도
  • 실제 환경에서의 AI 성능 및 한계점 파악에 집중
  • 안전한 AI 시스템 구축을 위한 실세계 데이터 기반 접근 방식

단점

  • 실제 환경에서 AI 성능이 예측 불가능한 인간 행동에 노출될 때 저하됨
  • 시뮬레이션 환경과 실제 환경 간의 복잡성 차이로 인한 결과 일반화의 어려움
  • AI 에이전트가 사용자에게 지나치게 친절하게 행동하여 비즈니스 성과에 해를 끼칠 수 있음
  • 지속적인 작업에서 LLM의 신뢰성 부족 문제

활용 사례AI 요약

  • AI 에이전트의 장기 비즈니스 의사결정 능력 측정
  • 자율 무인 매장 운영 안전성 검증
  • AI 에이전트의 보상 해킹·보안 취약점 사전 탐지
  • AI 프론티어 모델의 실환경 성능 평가
  • 자율 조직 도입 전 리스크 시뮬레이션

사용자 리뷰

리뷰를 불러오는 중...

대안 도구

이 도구 대신 사용할 수 있는 대안