
스텝펀
StepFun
중국 스타트업 계약성진이 개발한 고성능 멀티모달 거대 언어 모델
검증된 사실
- 최근 변경
- 2026-05-24 StepFun이 엔드-투-엔드 실시간 음성 모델 'StepAudio 2.5 Realtime'을 공개했습니다. 해당 모델은 2026년 4월 기준 ASR·TTS·실시간 대화 5개 벤치마크 전 부문에서
2026-06-20 직접 확인 · 자동 검증 데이터
제품 화면

2026-06-20 확인
가격 정보
API 사용량에 따른 종량제(Pay-as-you-go) 방식으로 운영됩니다. Step 3.5 Flash 모델의 경우 100만 토큰당 입력 $0.1, 출력 $0.3 수준이며, 신규 가입자에게는 테스트를 위한 일정량의 무료 토큰을 제공합니다. 고성능 모델인 Step-2 등은 토큰당 단가가 더 높게 책정됩니다.
최근 업데이트와 소식
- 투자StepFun, 홍콩 IPO 앞두고 약 25억 달러 조달 추진
StepFun이 홍콩 증시 상장을 앞두고 약 25억 달러에 달하는 자금 조달을 추진하고 있습니다. 중국 AI 기업 단일 라운드 최대 규모로, 레드칩(VIE) 구조를 해체하고 주식회사로 전환해 6월 30일 전 홍콩 상장 신청을 목표로 합니다.
근거: 중국 AI 스타트업 StepFun이 홍콩 IPO를 앞두고 약 25억 달러 조달에 근접했다고 2026년 5월 8일 보도됐습니다.
- 투자StepFun, 시리즈 B+ 7억 1,800만 달러 유치
상하이 AI 유니콘 StepFun이 시리즈 B+ 라운드에서 50억 위안(약 7억 1,800만 달러)을 유치했습니다. 알리바바·텐센트 등 기존 투자자가 주도하고 중동 국부펀드가 신규 참여해 파운데이션 모델 개발과 단말 에이전트 출시에 투입합니다.
근거: 상하이 AI 유니콘 StepFun이 2026년 1월 시리즈 B+ 라운드에서 7억 1,800만 달러 이상을 유치했습니다.
소개AI 요약
활용 워크플로우
핵심 차별점: 1조 파라미터 규모의 Step-2 모델과 초장문 문맥 처리 능력을 결합하여 복잡한 멀티모달 데이터를 인간 수준의 논리로 통합 추론하는 AI 생태계
주요 기능AI 요약
- 1조 파라미터 규모의 Step-2 MoE 모델
- Step-3.5-Flash: 196B 파라미터, Apache 2.0 오픈소스 (2026-02)
- 512k 토큰 초장문 문맥 지원
- 텍스트·이미지·비디오·오디오 멀티모달 이해
- Step-Audio 2 산업용 음성 언어 모델
- 실시간 웹 검색 엔진 통합
활용 사례AI 요약
- 복잡한 장문 문서 분석 및 요약
- 멀티모달 콘텐츠 생성 및 편집
- 기업용 맞춤형 AI 에이전트 구축
- 오디오 감정·화자 분석 및 이해
- 이미지 생성 및 빠른 이미지 편집
사용자 리뷰
리뷰를 불러오는 중...
대안 도구
이 도구 대신 사용할 수 있는 대안
챗GPT
OpenAI
GPT-5.5 Instant 기본 탑재, 환각 52.5% 감소와 강화된 개인화를 제공하는 AI 어시스턴트
제미니
텍스트와 이미지 분석은 물론 구글 앱 연동으로 업무와 일상의 생산성을 높여주는 멀티모달 AI 어시스턴트
클로드
Anthropic
긴 문서와 코드를 다루는 추론에 강하고, 대화 옆 아티팩트로 결과물을 바로 확인하는 AI 어시스턴트입니다. 코딩과 문서 분석 작업에 특히 잘 맞습니다.
딥시크
Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.
API 토큰 단가가 낮고 추론 과정을 단계별로 보여주는 MIT 라이선스 오픈 가중치 LLM입니다. 자체 서버 호스팅과 OpenAI 호환 API를 함께 지원합니다.
미니맥스
텍스트와 이미지 프롬프트를 통해 시네마틱 수준의 고화질 동영상을 생성하는 MiniMax의 플래그십 AI 비디오 플랫폼
캐릭터 AI
전 세계 사용자들이 만든 수백만 개의 가상 캐릭터와 몰입감 넘치는 역할극 및 대화를 즐길 수 있는 AI 플랫폼