큐웬 3

큐웬 3

Qwen 3

추론·코딩·다국어에 강한 알리바바 오픈소스 LLM 시리즈 (0.6B~235B, Apache 2.0)

무료WebHugging FaceModelScope오픈소스LLM 기반
웹사이트 방문하기qwen.ai

검증된 사실

라이브 가격
Free · 무료2026-06-15 확인
최신 버전
Qwen 3.7-Plus2025-04-28
GitHub
★ 27,271
최근 변경
2026-05-20 알리바바, 항저우 클라우드 서밋에서 Qwen3.7-Max 공식 발표—에이전트 시대 겨냥 100만 토큰 컨텍스트 플래그십 모델 출시. 소스: https://www.digitalapplied.com/

2026-06-15 직접 확인 · 자동 검증 데이터

제품 화면

큐웬 3 제품 화면

2026-06-15 확인

가격 정보

무료시작 가격: Free / $0.05/1M tokens (API)라이브 확인 2026-06-15

Qwen은 오픈 소스 모델로 모델 가중치를 무료로 다운로드하여 로컬 환경에서 사용할 수 있다. 알리바바 클라우드의 DashScope API를 통해 이용할 경우 사용량 기반(Pay-as-you-go)으로 과금된다. 웹 데모나 특정 플랫폼에서는 무료로 대화형 인터페이스를 이용할 수 있다.

가격표 확인하기

최근 업데이트와 소식

  • 버전 업데이트
    Alibaba, Qwen3.6-Plus·Qwen3.6-Max-Preview 공개

    Alibaba가 2026년 4월 2일 Qwen3.6-Plus를, 4월 20일 가장 강력한 Qwen3.6-Max-Preview를 공개했습니다. 에이전틱 코딩·멀티모달 추론이 크게 향상됐고 6대 코딩 벤치마크에서 1위를 기록했습니다.

    근거: Decrypt: 'Alibaba Drops Qwen 3.6 Max Preview—Its Most Powerful Model Yet' (Qwen3.6-Plus April 2, Max-Preview April 20, 2026)

  • 버전 업데이트
    Alibaba, Qwen3.5·Qwen3.5-Plus 출시 — 201개 언어 지원

    Alibaba가 2026년 2월 16일 Qwen3.5와 Qwen3.5-Plus를 출시했습니다. Qwen3.5는 오픈웨이트이며 201개 언어·방언을 지원(이전 82개)하고, 속도·비용 등 여러 객관 지표에서 미국 경쟁 모델을 능가한다고 주장합니다.

    근거: CNBC (2026-02-17): 'Alibaba unveils Qwen3.5 as China's chatbot race shifts to AI agents' (released February 16, 2026)

소개AI 요약

Qwen 3는 알리바바 클라우드가 개발한 최신 세대 대형 언어 모델 시리즈로, 하나의 모델에서 사고 모드와 비사고 모드를 전환하는 하이브리드 추론 방식을 씁니다. 코딩, 수학, 다국어 처리를 두루 다루며 119개 언어가 학습 데이터에 포함됩니다. 2025년 4월 28일 Apache 2.0 오픈소스로 출시되었으며, 0.6B~235B 밀집 모델과 MoE 모델(30B-A3B, 235B-A22B)로 구성됩니다. 이후 Qwen3.6-Plus(2026년 4월), Qwen3.7(2026년 5월)로 시리즈가 확장되었습니다.

활용 워크플로우

자율형 AI 에이전트 개발자로컬 시스템과 외부 API를 연동한 복잡한 코딩 에이전트 구축할 때

MCP 환경 구성

네이티브 Model Context Protocol(MCP)을 통해 로컬 파일 시스템 및 외부 도구의 스키마를 모델에 정의하여 입력합니다.

Thinking Mode 논리 설계

하이브리드 추론 엔진의 'Thinking Mode'를 활성화하여 복잡한 시스템 아키텍처를 분석하고 도구 호출 순서를 논리적으로 설계합니다.

에이전트 실행 및 도구 연동

vLLM 또는 Ollama를 통해 MCP 기반의 자율 에이전트를 구동하여 실시간 파일 수정 및 API 연동 결과를 도출합니다.

연동Hugging FaceOllamavLLMModel Context Protocol (MCP)

핵심 차별점: 하이브리드 추론 엔진을 통해 깊이 있는 사고(Thinking)와 빠른 응답(Fast)을 선택할 수 있는 유연성과 네이티브 MCP 지원을 통한 강력한 에이전트 연동 능력

주요 기능AI 요약

  • 하이브리드 추론 모드 (사고/비사고 동적 전환)
  • 0.6B~235B 다양한 크기의 밀집·MoE 모델 제공
  • 36조 토큰·119개 언어 학습 데이터
  • 코딩·수학·논리 추론 벤치마크 최상위권
  • Apache 2.0 라이선스 상업적 무료 사용 가능

장점 & 단점AI 분석

공식 정보와 공개 피드백을 함께 정리한 참고 메모입니다

장점

  • 코딩과 수학 벤치마크에서 GPT-4o와 견줄 만한 점수를 내고, 119개 언어가 학습 데이터에 포함되어 한국어 등 비영어권 처리도 무난한 편입니다.
  • MoE(Mixture-of-Experts) 구조라 235B 모델도 한 번에 활성화되는 파라미터가 22B 수준에 그쳐, 전체 크기 대비 추론 비용 부담이 작습니다.
  • 0.6B부터 235B까지 라인업이 갖춰져 있어 모바일·엣지 기기부터 대규모 서버까지 환경에 맞춰 골라 쓸 수 있습니다.
  • Apache 2.0 라이선스로 가중치가 공개되어 로컬 배포와 파인튜닝을 자유롭게 할 수 있습니다.
  • 복잡한 추론, 수학, 코딩에 특화된 '사고 모드'와 빠른 일반 대화를 위한 '비사고 모드' 전환 기능 제공
  • 수학, 코드 생성, 논리 추론 등에서 이전 모델 대비 향상된 추론 능력
  • 창의적 글쓰기, 역할극, 다중 턴 대화 등에서 뛰어난 인간 선호도 정렬
  • 119개 이상의 언어 및 방언 지원, 강력한 다국어 명령어 수행 및 번역 기능

단점

  • 고난도 논리 문제에서는 여전히 간헐적인 환각 현상이 보고됩니다.
  • 특정 지식의 암기력이나 정밀도 면에서는 딥시크(DeepSeek) 모델보다 다소 떨어진다는 사용자 평가가 있습니다.
  • Omni 모델로 비디오·오디오를 실시간 처리하려면 상당한 VRAM(GPU 메모리)이 필요해, 개인용 PC에서 전체 성능을 끌어내기에는 진입 장벽이 있는 편입니다.
  • 공간 추론 능력은 상대적으로 덜 강력함
  • 코딩 성능이 기대만큼 뛰어나지 않을 수 있음 (코더 특화 모델은 다를 수 있음)

활용 사례AI 요약

  • 오픈소스 LLM 기반 자체 AI 앱 개발
  • 코딩 어시스턴트 및 자동화 에이전트 구축
  • 수학·논리 추론 특화 파인튜닝
  • 엣지·온디바이스 경량 모델 배포 (0.6B~4B)

사용자 리뷰

리뷰를 불러오는 중...

대안 도구

이 도구 대신 사용할 수 있는 대안