Проект / TypeScript

sinmb79/local-korean-xtts-engine: Локальный движок синтеза корейской речи XTTS-v2 для коротких видео

Создавайте реалистичные корейские голосовые дорожки для шортсов локально, без облачных сервисов и с сохранением своего голоса.

Проект объединяет корейскую предобработку текста, модель XTTS-v2 и локальный пайплайн генерации. Вы загружаете образец своего голоса (WAV-файл), скрипт на корейском, а система создаёт цельный аудиотрек одним дублем, оптимизируя паузы и произношение под...

★ 14 TypeScript Форки 1 Issue 0 Оценка 7/10 Карточка проверена

Открыть на GitHub Помочь с установкой

Для кого это

Для создателей корейского контента (шортсов, обзоров, образовательных видео), разработчиков, работающих с TTS, и всех, кто хочет избежать зависимости от облачных сервисов синтеза речи.

Проблема / задача

Стандартные мультиязычные TTS плохо справляются с корейским: неестественное произношение, роботоподобные паузы между словами, шумы в конце фраз, а также ограничения облачных сервисов на редактирование и повторную генерацию.

Как это работает

Что видно по README

Это TypeScript/Node.js обёртка для модели XTTS-v2, заточенная под синтез корейской речи для коротких видео. Основная идея — генерировать narration одним куском (one-take), а не склеивать сцены, чтобы сохранить естественное дыхание и интонацию. Проект включает CLI для удобной работы, предобработчик текста и Python-враппер для запуска модели. Всё работает локально на Windows.

Ключевые возможности

Синтез речи одним дублем (one-take) для естественного звучанияПоддержка нескольких референсных голосовых образцов для одного спикераТонкая настройка скорости, громкости и постобработки звукаОптимизация текста под субтитры и корейскую пунктуацию

Технологии

TypeScriptPythonXTTS-v2Node.js CLIPyTorchFFmpeg

Интересный факт

Проект включает пресет 'issue-shorts-dad', который применяет специфичную обработку, используемую в студии Issue Shorts Studio для создания контента в стиле 'папиных шортсов'.

С чего начать

Установите Python-окружение скриптом для Windows
Подготовьте WAV-файл с образцом своего голоса (от 10 секунд)
Запустите синтез через Node.js CLI, указав текст и путь к голосу

Оценка GitRadar

Удобство

6/10

Свежесть

8/10

Перспектива

7/10

Монетизация

6/10

Общая оценка

7/10

Вердикт GitRadar

Стоит попробовать, если вы создаёте корейский контент и хотите полный контроль над голосовым синтезом. Проект решает конкретную боль, но требует технической сноровки для настройки.

Наблюдения по обновлениям

Проект молодой (11 звёзд, 1 форк), но README подробный, код структурирован, есть тесты. Видна практическая ориентация на решение конкретной задачи.

Что мы проверили

Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.

Исходный репозиторий: https://github.com/sinmb79/local-korean-xtts-engine
Лицензия: MIT
Создан на GitHub: 19 апреля 2026 г.
Последнее обновление репо: 19 апреля 2026 г.
Последняя проверка GitRadar: 19 апреля 2026 г.
Изученные файлы: README.en.md, src/index.ts, package.json, src/cli.ts, README.md, tests/cli.test.ts

FAQ

Что это такое?

Инструмент для локального синтеза корейской речи из текста с использованием вашего голоса в качестве образца.

Для кого подходит?

Для создателей видео на корейском языке, которые хотят использовать реалистичный синтез речи без облачных ограничений.

Источники

GitHub исходный код и активность
README описание, ссылки, стартовые материалы

Нужна помощь с sinmb79/local-korean-xtts-engine?

Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.

Смотреть услуги Открыть на GitHub Написать в Telegram