Что это такое?
Инструмент для локального синтеза корейской речи из текста с использованием вашего голоса в качестве образца.
Проект объединяет корейскую предобработку текста, модель XTTS-v2 и локальный пайплайн генерации. Вы загружаете образец своего голоса (WAV-файл), скрипт на корейском, а система создаёт цельный аудиотрек одним дублем, оптимизируя паузы и произношение под...
Для создателей корейского контента (шортсов, обзоров, образовательных видео), разработчиков, работающих с TTS, и всех, кто хочет избежать зависимости от облачных сервисов синтеза речи.
Стандартные мультиязычные TTS плохо справляются с корейским: неестественное произношение, роботоподобные паузы между словами, шумы в конце фраз, а также ограничения облачных сервисов на редактирование и повторную генерацию.
Проект объединяет корейскую предобработку текста, модель XTTS-v2 и локальный пайплайн генерации. Вы загружаете образец своего голоса (WAV-файл), скрипт на корейском, а система создаёт цельный аудиотрек одним дублем, оптимизируя паузы и произношение под особенности языка.
Это TypeScript/Node.js обёртка для модели XTTS-v2, заточенная под синтез корейской речи для коротких видео. Основная идея — генерировать narration одним куском (one-take), а не склеивать сцены, чтобы сохранить естественное дыхание и интонацию. Проект включает CLI для удобной работы, предобработчик текста и Python-враппер для запуска модели. Всё работает локально на Windows.
Проект включает пресет 'issue-shorts-dad', который применяет специфичную обработку, используемую в студии Issue Shorts Studio для создания контента в стиле 'папиных шортсов'.
Стоит попробовать, если вы создаёте корейский контент и хотите полный контроль над голосовым синтезом. Проект решает конкретную боль, но требует технической сноровки для настройки.
Проект молодой (11 звёзд, 1 форк), но README подробный, код структурирован, есть тесты. Видна практическая ориентация на решение конкретной задачи.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Инструмент для локального синтеза корейской речи из текста с использованием вашего голоса в качестве образца.
Для создателей видео на корейском языке, которые хотят использовать реалистичный синтез речи без облачных ограничений.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.