TTS (Premium)

Prev Next

Classic/VPC 환경에서 이용 가능합니다.

변환할 텍스트와 음색, 속도, 감정 등을 파라미터로 입력받아 음성을 합성합니다.

요청

요청 형식을 설명합니다. 요청 형식은 다음과 같습니다.

메서드 URI
POST /tts

요청 헤더

CLOVA Voice API에서 공통으로 사용하는 헤더에 대한 정보는 CLOVA Voice 공통 헤더를 참조해 주십시오.

요청 바디

요청 바디에 대한 설명은 다음과 같습니다.

필드 타입 필수 여부 설명
speaker String Required 음성 합성 시 사용할 목소리 종류
text String Required 음성으로 변환할 텍스트
  • UTF-8 인코딩된 텍스트만 지원
  • 기호나 괄호 안의 텍스트는 미변환
  • 언어별 최대 글자 수 제한
    • 한국어, 일본어, 중국어, 대만어 : 2,000자
    • 영어, 스페인어 : 3,000자
volume Integer Optional 음성 크기
  • -5~5 (기본값: 0)
    • -5: 0.5배 작게 합성
    • 0: 정상 크기로 합성
    • 5: 1.5배 크게 합성
speed Integer Optional 음성 속도
  • -5~10 (기본값: 0)
    • -5: 2.0배 속도 (duration: 0.5배 / 빠르게)
    • 0: 원음의 속도
    • 10: 0.5배 속도 (duration: 2.0배 / 느리게)
pitch Integer Optional 음성 높낮이
  • -5~5 (기본값: 0)
    • -5: 1.2배 높게 합성
    • 0: 정상 높낮이로 합성
    • 5: 0.8배 낮게 합성
emotion Integer Optional 음성의 감정 정도
  • 지원 목소리: nara | vara | vmikyung | vdain | vyuna | vgoeun | vdaeseong
  • 0~3 (기본값: 0)
    • 0: 중립
    • 1: 슬픔
    • 2: 기쁨
    • 3: 분노 (nara 미지원)
emotion-strength Integer Optional 음성의 감정 강도
  • 지원 목소리: vara | vmikyung | vdain | vyuna | vgoeun | vdaeseong
  • 0~2 (기본값: 1)
    • 0: 약함
    • 1: 보통
    • 2: 강함
format String Optional 음성 파일 형식
  • mp3 (기본값) | wav
sampling-rate Integer Optional 음성의 샘플링 레이트
  • wav 형식만 지원
  • 8000 | 16000 | 24000 (기본값)| 48000
    • 예외적으로 mijin16000 레이트만 지원
alpha Integer Optional 음색
  • -5~5 (기본값: 0)
    • 0보다 클 경우: 높은 음색
    • 0보다 작을 경우: 낮은 음색
end-pitch Integer Optional 음성의 끝음 처리
  • 지원 목소리: clara | matt | meimei | liangliang | chiahua | kuanlin | carmen | jose | d-로 시작하는 목소리 전체(<예시> dara)
  • -5~5 (기본값: 0)
    • 0보다 클 경우: 높은 끝음
    • 0보다 작을 경우: 낮은 끝음

음성 합성 목소리 목록

음성 합성에 사용될 목소리 종류에 대한 상세 설명은 다음과 같습니다.

필드 이름 언어 설명
dara_ang 아라(화남) 한국어 여성
jinho 진호 한국어 남성
mijin 미진 한국어 여성
napple 늘봄 한국어 여성
nara_call 아라(상담원) 한국어 여성
nara 아라 한국어 여성
nbora 보라 한국어 여성
ndaeseong 대성 한국어 남성
ndain 다인 한국어 아동(여)
ndonghyun 동현 한국어 남성
nes_c_hyeri 혜리 한국어 여성
nes_c_kihyo 기효 한국어 남성
nes_c_mikyung 미경 한국어 여성
nes_c_sohyun 소현 한국어 여성
neunseo 은서 한국어 여성
neunwoo 은우 한국어 남성
neunyoung 은영 한국어 여성
ngaram 가람 한국어 아동(여)
ngoeun 고은 한국어 여성
ngyeongjun 경준 한국어 남성
nhajun 하준 한국어 아동(남)
nheera 희라 한국어 여성
nian 이안 한국어 남성
nihyun 이현 한국어 여성
njaewook 재욱 한국어 남성
njangj 드림 한국어 여성
njihun 지훈 한국어 남성
njihwan 지환 한국어 남성
njinho 진호 한국어 남성
njiwon 지원 한국어 여성
njiyun 지윤 한국어 여성
njonghyeok 종혁 한국어 남성
njonghyun 종현 한국어 남성
njooahn 주안 한국어 남성
njoonyoung 준영 한국어 남성
nkitae 기태 한국어 남성
nkyunglee 경리 한국어 여성
nkyungtae 경태 한국어 남성
nkyuwon 규원 한국어 남성
nmammon 악마 마몬 한국어 남성
nmeow 야옹이 한국어 아동(여)
nmijin 미진 한국어 여성
nminjeong 민정 한국어 여성
nminsang 민상 한국어 남성
nminseo 민서 한국어 여성
nminyoung 민영 한국어 여성
nmovie 최무비 한국어 남성
noyj 봄달 한국어 여성
nraewon 래원 한국어 남성
nreview 박리뷰 한국어 남성
nsabina 마녀 사비나 한국어 여성
nsangdo 상도 한국어 남성
nseonghoon 성훈 한국어 남성
nseungpyo 승표 한국어 남성
nshasha 샤샤 한국어 여성
nsinu 신우 한국어 남성
nsiyoon 시윤 한국어 남성
nsujin 수진 한국어 여성
nsunhee 선희 한국어 여성
nsunkyung 선경 한국어 여성
ntaejin 태진 한국어 남성
ntiffany 기서 한국어 여성
nwontak 원탁 한국어 남성
nwoof 멍멍이 한국어 아동(남)
nwoosik 우식 한국어 남성
nyeji 예지 한국어 여성
nyejin 예진 한국어 여성
nyounghwa 정영화 한국어 여성
nyoungil 영일 한국어 남성
nyoungmi 영미 한국어 여성
nyujin 유진 한국어 여성
nyuna 유나 한국어 여성
dara-danna 아라&안나 한국어+영어(미국) 여성
dsinu-matt 신우&매트 한국어+영어(미국) 남성
liangliang 량량 중국어 남성
meimei 메이메이 중국어 여성
dayumu 아유무 일본어 남성
ddaiki 다이키 일본어 남성
deriko 에리코 일본어 여성
dhajime 하지메 일본어 남성
dmio 미오 일본어 여성
dnaomi_formal 나오미(뉴스) 일본어 여성
dnaomi_joyful 나오미(기쁨) 일본어 여성
dnaomi 나오미 일본어 여성
driko 리코 일본어 여성
dsayuri 사유리 일본어 여성
dtomoko 토모코 일본어 여성
nnaomi 나오미 일본어 여성
nsayuri 사유리 일본어 여성
ntomoko 토모코 일본어 여성
shinji 신지 일본어 남성
clara 클라라 영어 여성
danna 안나 영어 여성
djoey 조이 영어 여성
matt 매트 영어 남성
carmen 카르멘 스페인어 여성
jose 호세 스페인어 남성
chiahua 차화 대만어 여성
kuanlin 관린 대만어 남성

요청 예시

요청 예시는 다음과 같습니다.

curl --location --request POST 'https://naveropenapi.apigw.gov-ntruss.com/tts-premium/v1/tts' \
--header 'X-NCP-APIGW-API-KEY-ID: {앱 등록 시 발급받은 Client ID}' \
--header 'X-NCP-APIGW-API-KEY: {앱 등록 시 발급 받은 Client Secret}' \
--header 'Content-Type: application/x-www-form-urlencoded' \
--data-urlencode 'speaker=nara' \
--data-urlencode 'text=안녕하세요 ' \
--data-urlencode 'volume=0' \
--data-urlencode 'speed=-1' \
--data-urlencode 'pitch=1' \
--data-urlencode 'emotion=2' \
--data-urlencode 'emotion-strength=1' \
--data-urlencode 'format=wav' \
--data-urlencode 'sampling-rate=8000' \
--data-urlencode 'alpha=0' \
--data-urlencode 'end-pitch=0'

응답

응답 형식을 설명합니다.

응답 바디

응답 바디에 대한 설명은 다음과 같습니다.

필드 타입 필수 여부 설명
응답받은 TTS 오디오 Binary - MP3 또는 WAV 형식의 바이너리 음성 데이터

응답 상태 코드

CLOVA Voice API에서 공통으로 사용하는 응답 상태 코드에 대한 정보는 CLOVA Voice 공통 응답 상태 코드를 참조해 주십시오.

응답 예시

응답 예시는 다음과 같습니다.

{MP3 또는 WAV 형식의 바이너리 음성 데이터}