
올라마
Ollama
Llama 3, DeepSeek 등 오픈소스 LLM을 로컬에서 간편하게 실행하는 도구
검증된 사실
- 라이브 가격
- Free · 무료2026-06-20 확인
- 최신 버전
- v0.30.82025-05-21
- 최근 변경
- 2026-06-12 Ollama v0.30.8이 출시되었습니다. `ollama launch` 프로바이더 선택 오류 수정, 프롬프트 캐싱 개선, MLX 추론 안정화, 재귀 모델의 경계별 상태 처리 개선이 포함되었습니다
2026-06-20 직접 확인 · 자동 검증 데이터
제품 화면

2026-06-20 확인
가격 정보
로컬 환경에서의 사용은 완전 무료입니다. 클라우드 모델 실행 및 협업 기능을 제공하는 Pro 플랜은 월 $20, 더 높은 사용량과 비공개 모델을 지원하는 Max 플랜은 월 $100에 제공됩니다. 무료 플랜에서도 무제한으로 공개 모델을 다운로드하여 로컬에서 실행할 수 있습니다.
최근 업데이트와 소식
- 소식2026-05 v0.30.0-rc23 릴리스(RC).
2026-05 v0.30.0-rc23 릴리스(RC).
- 소식2026-05 v0.24.0 — Codex App 통합, Apple Silicon MLX 샘플러 개선.
2026-05 v0.24.0 — Codex App 통합, Apple Silicon MLX 샘플러 개선.
- 버전 업데이트2025-05 v0.7.1 — 안정 버전 릴리스.
2025-05 v0.7.1 — 안정 버전 릴리스.
소개AI 요약
활용 워크플로우
입력
올라마
출력
프라이빗 RAG 시스템 구축
풀스택 개발자가 LangChain/LlamaIndex를 사용하여 로컬 문서를 외부 유출 없이 분석하는 폐쇄형 검색 엔진 구축
커스텀 페르소나 생성
AI 연구원이 Modelfile에 특정 시스템 프롬프트를 설정하여 특정 기술 도메인에 특화된 로컬 챗봇 생성
Ollama Cloud 동기화
스타트업 CTO가 로컬에서 테스트한 모델 설정을 클라우드에 푸시하여 팀원 간 모델 공유 및 배포 자동화
핵심 차별점: 복잡한 종속성 설치 없이 단일 실행 파일로 로컬 하드웨어 리소스를 자동 최적화하여 최신 오픈소스 LLM을 즉시 서빙하는 제로 컨피그 런타임
주요 기능AI 요약
- Llama·Mistral·DeepSeek·Gemma 등 주요 모델 원클릭 실행
- OpenAI 호환 REST API 내장
- macOS·Windows·Linux 크로스 플랫폼 지원
- Apple Silicon MLX 가속 지원
- llama.cpp 기반 GGUF 파일 포맷 직접 지원
- Codex App 통합 (v0.24.0)
- 멀티모달 및 Function Calling 지원
활용 사례AI 요약
- 로컬 RAG 파이프라인 구축
- 개인 보안용 오프라인 AI 비서
- 오프라인 코드 생성 및 리뷰
- CI/CD 내 LLM 기반 자동화 테스트
사용자 리뷰
리뷰를 불러오는 중...
대안 도구
이 도구 대신 사용할 수 있는 대안
클로바 AI
Naver
한국어와 국내 맥락에 최적화된 하이퍼클로바 X로 AI 서비스를 개발·배포하는 통합 플랫폼
애스크코디
코드 생성부터 테스트, 문서화까지 개발 전 과정을 지원하는 멀티 모델 기반 AI 코딩 어시스턴트
컨티뉴
IDE 안에서 원하는 LLM을 선택해 코드 맥락을 제어하는 오픈소스 AI 코딩 어시스턴트
세레브라스
세계 최대 크기의 AI 전용 칩으로 기존 GPU보다 수십 배 빠른 초고속 LLM 추론 환경을 제공하는 API 플랫폼
블랙박스 AI
여러 AI 모델을 골라 쓰고 2억 개 이상의 저장소를 검색하며 실시간 자동완성까지 제공하는 AI 코딩 어시스턴트
그록
자체 LPU 칩으로 오픈소스 모델을 빠르게 돌리는 추론 전용 클라우드 플랫폼입니다. GPU 기반 서비스보다 초당 토큰 생성량이 높고 첫 응답까지의 지연이 짧은 점이 핵심입니다.