This organization was marked as archived by an administrator on Aug 21, 2024. It is no longer maintained.
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
특징
OpenAI에서 제공하는 Audio API 중 하나. tts-1 or tts-1-hd 모델 사용.
텍스트를 음성 오디오로 변환하는 데 사용.
6개의 빌트인 음성이 제공됨
여러 언어 음성 인식 가능 (한국어 포함) 단, 영어가 제일 성능 높음
스트리밍을 사용한 실시간 오디오 출력 제공
지원되는 출력 파일 형식은 mp3이지만 opus, aac, flac 등도 가능
감정(tone)을 조절하는 기능은 없음
파라미터
실시간 스트리밍?
Speech API에서 chunk transfer encoding을 사용하여 실시간 오디오 스트리밍을 지원하는데, 전체 파일이 생성되어 액세스할 수 있게 되기 전에 오디오를 재생할 수 있게 하는 기능임
어떻게 활용할지
사용법
python :
node:
Beta Was this translation helpful? Give feedback.
All reactions