Supertonic TTS 커스텀 프록시에서 공식 serve로 갈아탄 썰
·
Study/AI
로컬 TTS 서버를 운영한 지 꽤 됐다. Supertonic이라는 한국 회사(Supertone)가 만든 TTS 엔진을 FastAPI로 직접 감싸서 OpenAI 호환 /v1/audio/speech 엔드포인트로 만들어 쓰고 있었는데 — 예전에 썼던 Supertonic 3 업그레이드 후기 — 온디바이스 TTS 프록시를 v2에서 v3로 올리며 에서 다뤘던 그 프록시다 — v1.3.1부터 공식 serve CLI가 나오면서 모든 게 달라졌다. 원래 구조예전에는 이렇게 생겼었다:supertonic_openai_tts_proxy/├── main.py # FastAPI 앱, 엔드포인트 정의├── schemas.py # Pydantic 요청 모델├── synth.py # super..
Hermes Agent core 수정 없이 Supertonic2 TTS 붙이기
·
Study/AI
Hermes에서 TTS 엔진을 조금 바꿔보고 싶어서 작은 프록시 서버를 만들었습니다.저장소는 여기입니다.https://github.com/sanguneo/supertonic-openai-tts-proxy GitHub - sanguneo/supertonic-openai-tts-proxy: OpenAI-compatible local TTS proxy for supertonicOpenAI-compatible local TTS proxy for supertonic. Contribute to sanguneo/supertonic-openai-tts-proxy development by creating an account on GitHub.github.com 이 프로젝트는 supertone-inc/supertonic..
한국어 TTS 비교 후기: EdgeTTS를 거쳐 Supertonic-2로 정착하기까지
·
Study/AI
들어가며텔레그램에서 바로 보낼 한국어 음성메시지용 TTS가 필요했습니다. 조건은 비교적 분명했습니다. WSL에서 돌아가야 했고, 외장 GPU 없이도 실사용 가능해야 했으며, 무엇보다 한국어가 어색하지 않아야 했습니다. 단순히 음성이 생성되는 정도가 아니라, 실제로 계속 쓸 수 있을 정도의 품질이 필요했습니다.처음에는 EdgeTTS로 시작했습니다. 붙이기 쉽고 결과도 빨리 나와서 시작점으로는 나쁘지않았습니다. 다만 쓰다 보니 욕심이 생겼습니다. “조금 더 자연스럽고, 조금 더 만족스러운 한국어 TTS가 없을까?”라는 생각이 들었고, 그다음으로 Kokoro를 직접 붙여봤습니다. 이후 여러 모델 데모를 더 비교해 본 끝에, 최종적으로는 Supertonic-2에 정착하게 됐습니다.참고로 ElevenLabs도 꽤..