STT

AI 개념
1분 읽기

음성을 텍스트로 변환하는 AI 기술입니다.

다른 이름
음성 인식Speech-to-TextASR자동 음성 인식

상세 설명

STT(Speech-to-Text, 음성 인식)는 사람의 음성을 컴퓨터가 이해할 수 있는 텍스트로 변환하는 기술입니다. ASR(Automatic Speech Recognition)이라고도 합니다. 딥러닝 기반 모델(Whisper, DeepSpeech, Conformer 등)이 소음 환경에서도 높은 정확도를 달성합니다. 화상 회의 자막, 음성 메모 변환, 콜센터 통화 분석, 음성 명령 인터페이스, 접근성 서비스 등에 활용됩니다. 다국어 지원, 화자 분리(Speaker Diarization), 실시간 처리 등이 주요 기술 과제입니다.

관련 용어

TTSNLP딥러닝