TTS
용어 이름 복사
AI 개념약 1분 읽기
입력한 텍스트를 사람이 직접 말하는 것처럼 자연스러운 음성으로 변환해 들려주는 AI 기술입니다.
다른 이름
음성 합성Text-to-Speech텍스트 음성 변환
상세 설명
TTS(Text-to-Speech, 음성 합성)는 텍스트를 사람의 목소리처럼 자연스럽게 읽어 주는 기술입니다. 과거의 기계적인 음성과 달리, Tacotron·VITS 같은 딥러닝 기반 TTS는 억양·속도·감정을 조절하고, 짧은 샘플만으로 특정 화자의 목소리를 흉내 내는 음성 복제(Voice Cloning)까지 가능합니다. 오디오북·내비게이션 안내·시각장애인 접근성 지원·AI 어시스턴트·영상 더빙·교육 콘텐츠 제작 등에 널리 쓰입니다. ElevenLabs, 네이버 CLOVA Voice, LOVO, Murf 등이 대표적인 서비스이며, 지원 언어와 음성의 자연스러움이 도구별로 차이가 큽니다.
도구 선택에서 중요한 이유
TTS 도구는 한국어 발음의 자연스러움에서 격차가 큽니다. 영어 음질이 뛰어나도 한국어 억양이 어색한 경우가 많아, 실제 사용할 언어로 직접 들어 보고 골라야 합니다. 감정·속도 조절, 음성 복제 허용 범위, 상업적 사용 라이선스, 생성 분량 대비 비용도 함께 따져야 콘텐츠 제작에 무리 없이 쓸 수 있습니다.
도구를 고를 때 확인할 점
- 실제 사용할 언어(특히 한국어) 발음과 억양이 자연스러운가
- 감정·속도·강세 등 세부 조절을 지원하는가
- 음성 복제 기능의 동의·라이선스 조건이 명확한가
- 월 생성 시간과 단가가 제작 분량에 맞는가
실제 적용 예시
유튜브 정보 채널 운영자가 대본을 TTS로 내레이션해 편집 시간을 줄이는 경우가 많습니다. 같은 대본도 도구마다 한국어 억양과 쉼표 처리에서 차이가 나므로, 핵심 문단 하나를 여러 도구로 변환해 들어 본 뒤 채널 톤에 맞는 음성을 고르는 방식이 효과적입니다.
관련 AI 도구
'TTS' 개념과 연관된 AI 도구
관련 용어
STT
음성 신호를 컴퓨터가 이해할 수 있는 텍스트 데이터로 변환하는 AI 기술입니다. 최근에는 Whisper, Gemini 등 딥러닝 모델을 통해 소음 환경에서도 높은 정확도를 제공하며 자동 자막, 회의록 작성 등에 활용...
NLP인간의 언어를 기계가 이해하고 생성하게 하는 AI 핵심 기술입니다. 문맥과 의도를 파악하는 NLU와 문장을 만드는 NLG를 포함하며, 현재는 거대언어모델(LLM)을 기반으로 고도화된 번역, 요약, 추론을 수행합니다....
딥러닝다층 인공 신경망을 통해 데이터의 복잡한 비선형 관계를 학습하는 머신러닝의 한 분야입니다. 데이터에서 특징(Feature)을 스스로 추출하며 이미지 인식, 자연어 처리, 생성형 AI 등 고도의 인지 능력이 필요한 분...