Andon Labs는 어떤 상황에서 사용하나요?

Andon Labs는 AI 에이전트의 장기 비즈니스 의사결정 능력 측정, 자율 무인 매장 운영 안전성 검증, AI 에이전트의 보상 해킹·보안 취약점 사전 탐지 등의 상황에서 활용할 수 있습니다.

Andon Labs의 주요 기능은 무엇인가요?

Andon Labs의 핵심 기능으로는 Vending-Bench: AI 장기 비즈니스 운영 성능 벤치마킹, Butter-Bench: 실환경 로봇 제어 성능 평가, 실시간 병렬 감시 에이전트(Oversight Agents) 등이 있습니다.

앤든 랩스

Andon Labs

AI 에이전트를 실제 환경에 배포해 안전성을 벤치마킹하고 자율 조직 구축 프로토콜을 개발하는 AI 안전 연구 스타트업

가격 문의desktopapiLLM 기반

웹사이트 방문하기andonlabs.com

검증된 사실

최근 변경: 2026-05-18 Andon Labs가 Claude, ChatGPT, Gemini, Grok 4개 모델에 각각 20달러 예산을 부여하고 라디오 방송 운영을 맡기는 실험을 진행하였으며, 모든 AI 에이전트가 안정적인

2026-06-20 직접 확인 · 자동 검증 데이터

제품 화면

2026-06-20 확인

가격 정보

가격 문의시작 가격: 가격 문의

자율 운영 조직 및 AI 안전 벤치마킹을 연구하는 플랫폼으로, 일반 사용자를 위한 구독 요금제는 공개되어 있지 않습니다. 서비스 이용이나 협업을 위해서는 공식 이메일을 통해 직접 문의해야 합니다.

가격표 확인하기

최근 업데이트와 소식

버전 업데이트2026-05-18
2025-01 Anthropic과 협업한 Project Vend — AI 에이전트가 실제 자판기를 운영, 가드레일 없이 설득 공격에 취약함을 실증.
2025-01 Anthropic과 협업한 Project Vend — AI 에이전트가 실제 자판기를 운영, 가드레일 없이 설득 공격에 취약함을 실증.
버전 업데이트2026-05-18
Andon Labs가 Claude, ChatGPT, Gemini, Grok 4개 모델에 각각 20달러 예산을 부여하고 라디오 방송 운영을 맡기는 실험을 진행하였으...
Andon Labs가 Claude, ChatGPT, Gemini, Grok 4개 모델에 각각 20달러 예산을 부여하고 라디오 방송 운영을 맡기는 실험을 진행하였으며, 모든 AI 에이전트가 안정적인 수익 창출과 스폰서 확보에 실패하였다고 발표하였습니다.
버전 업데이트2026-05-12
Andon Labs가 스웨덴 스톡홀름에 AI 에이전트 'Mona'(Google Gemini 기반)를 운영자로 내세운 실험적 카페를 오픈하였으며, 개점 이후 약 4...
Andon Labs가 스웨덴 스톡홀름에 AI 에이전트 'Mona'(Google Gemini 기반)를 운영자로 내세운 실험적 카페를 오픈하였으며, 개점 이후 약 4만 4,000 SEK(약 640만 원)의 매출을 기록하였습니다.

소개AI 요약

Andon Labs는 인간의 개입 없이도 안전하게 운영되는 '안전 자율 조직(SAO)'을 구축하는 AI 안전 스타트업입니다. Vending-Bench를 통해 AI 에이전트의 장기 비즈니스 의사결정 능력을 벤치마킹하고, Project Vend(무인 자판기)·Andon FM(AI 라디오) 등 실전 프로젝트를 통해 실제 환경에서의 안전 프로토콜을 개발합니다. Anthropic과의 협업으로 Claude 기반 자율 에이전트를 실제 배포·검증합니다.