한국어 TTS 비교 후기: EdgeTTS를 거쳐 Supertonic-2로 정착하기까지
·
Study/AI
들어가며텔레그램에서 바로 보낼 한국어 음성메시지용 TTS가 필요했습니다. 조건은 비교적 분명했습니다. WSL에서 돌아가야 했고, 외장 GPU 없이도 실사용 가능해야 했으며, 무엇보다 한국어가 어색하지 않아야 했습니다. 단순히 음성이 생성되는 정도가 아니라, 실제로 계속 쓸 수 있을 정도의 품질이 필요했습니다.처음에는 EdgeTTS로 시작했습니다. 붙이기 쉽고 결과도 빨리 나와서 시작점으로는 나쁘지않았습니다. 다만 쓰다 보니 욕심이 생겼습니다. “조금 더 자연스럽고, 조금 더 만족스러운 한국어 TTS가 없을까?”라는 생각이 들었고, 그다음으로 Kokoro를 직접 붙여봤습니다. 이후 여러 모델 데모를 더 비교해 본 끝에, 최종적으로는 Supertonic-2에 정착하게 됐습니다.참고로 ElevenLabs도 꽤..