← Все проекты
Проект / TypeScript

sinmb79/local-korean-xtts-engine: Локальный движок синтеза корейской речи XTTS-v2 для коротких видео

Создавайте реалистичные корейские голосовые дорожки для шортсов локально, без облачных сервисов и с сохранением своего голоса.

Проект объединяет корейскую предобработку текста, модель XTTS-v2 и локальный пайплайн генерации. Вы загружаете образец своего голоса (WAV-файл), скрипт на корейском, а система создаёт цельный аудиотрек одним дублем, оптимизируя паузы и произношение под...

★ 14 TypeScript Форки 1 Issue 0 Оценка 7/10 Карточка проверена

Для кого это

Для создателей корейского контента (шортсов, обзоров, образовательных видео), разработчиков, работающих с TTS, и всех, кто хочет избежать зависимости от облачных сервисов синтеза речи.

Проблема / задача

Стандартные мультиязычные TTS плохо справляются с корейским: неестественное произношение, роботоподобные паузы между словами, шумы в конце фраз, а также ограничения облачных сервисов на редактирование и повторную генерацию.

Как это работает

Проект объединяет корейскую предобработку текста, модель XTTS-v2 и локальный пайплайн генерации. Вы загружаете образец своего голоса (WAV-файл), скрипт на корейском, а система создаёт цельный аудиотрек одним дублем, оптимизируя паузы и произношение под особенности языка.

Что видно по README

Это TypeScript/Node.js обёртка для модели XTTS-v2, заточенная под синтез корейской речи для коротких видео. Основная идея — генерировать narration одним куском (one-take), а не склеивать сцены, чтобы сохранить естественное дыхание и интонацию. Проект включает CLI для удобной работы, предобработчик текста и Python-враппер для запуска модели. Всё работает локально на Windows.

Ключевые возможности

Синтез речи одним дублем (one-take) для естественного звучанияПоддержка нескольких референсных голосовых образцов для одного спикераТонкая настройка скорости, громкости и постобработки звукаОптимизация текста под субтитры и корейскую пунктуацию

Технологии

TypeScriptPythonXTTS-v2Node.js CLIPyTorchFFmpeg

Интересный факт

Проект включает пресет 'issue-shorts-dad', который применяет специфичную обработку, используемую в студии Issue Shorts Studio для создания контента в стиле 'папиных шортсов'.

С чего начать

  • Установите Python-окружение скриптом для Windows
  • Подготовьте WAV-файл с образцом своего голоса (от 10 секунд)
  • Запустите синтез через Node.js CLI, указав текст и путь к голосу

Оценка GitRadar

Удобство
6/10
Свежесть
8/10
Перспектива
7/10
Монетизация
6/10
Общая оценка
7/10

Вердикт GitRadar

Стоит попробовать, если вы создаёте корейский контент и хотите полный контроль над голосовым синтезом. Проект решает конкретную боль, но требует технической сноровки для настройки.

Наблюдения по обновлениям

Проект молодой (11 звёзд, 1 форк), но README подробный, код структурирован, есть тесты. Видна практическая ориентация на решение конкретной задачи.

Что мы проверили

Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.

Исходный репозиторий
https://github.com/sinmb79/local-korean-xtts-engine
Лицензия
MIT
Создан на GitHub
19 апреля 2026 г.
Последнее обновление репо
19 апреля 2026 г.
Последняя проверка GitRadar
19 апреля 2026 г.
Изученные файлы
README.en.md, src/index.ts, package.json, src/cli.ts, README.md, tests/cli.test.ts

FAQ

Что это такое?

Инструмент для локального синтеза корейской речи из текста с использованием вашего голоса в качестве образца.

Для кого подходит?

Для создателей видео на корейском языке, которые хотят использовать реалистичный синтез речи без облачных ограничений.

Источники

  • GitHub исходный код и активность
  • README описание, ссылки, стартовые материалы

Нужна помощь с sinmb79/local-korean-xtts-engine?

Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.