← Все проекты
Проект / Python

Manoharesh/Multilingual_OpenSource_Chatbot: GovUnified — голосовой ассистент для госуслуг на трёх языках

Производственный голосовой ассистент, который работает офлайн, понимает тамильский, хинди и английский, и отвечает строго по документам.

Это полноценный бэкенд для мультиязычного голосового чатбота, заточенный под низкую задержку и офлайн-работу. Включает FastAPI, RAG-архитектуру, потоковые ответы через SSE, веб-интерфейс и даже систему жалоб в PostgreSQL.

★ 30 Python Форки 0 Issue 0 Оценка 7/10 Карточка проверена

Для кого это

Для разработчиков, создающих голосовые интерфейсы для государственных или корпоративных сервисов, особенно в мультиязычных регионах.

Проблема / задача

Государственные порталы часто неудобны для неграмотных или пожилых людей, а голосовые ассистенты вроде Alexa не знают местных языков и не могут отвечать по официальным документам.

Как это работает

Ассистент слушает речь через Whisper, определяет язык, переводит вопрос на английский, ищет ответ в загруженных PDF через FAISS, генерирует ответ локальной моделью Ollama, переводит обратно и озвучивает через Edge-TTS. Всё работает асинхронно с Kafka для логирования.

Что видно по README

Это полноценный бэкенд для мультиязычного голосового чатбота, заточенный под низкую задержку и офлайн-работу. Включает FastAPI, RAG-архитектуру, потоковые ответы через SSE, веб-интерфейс и даже систему жалоб в PostgreSQL.

Ключевые возможности

Автоопределение и синтез речи на тамильском, хинди, английскомRAG-архитектура: ответы только по загруженным документамПотоковые ответы (SSE) и асинхронная обработка через KafkaЛокальный LLM через Ollama, полная приватностьВысококачественный нейросинтез с офлайн-запасным вариантом

Технологии

Python/FastAPIOllama (Qwen 2.5 3B)FAISS, SentenceTransformersWhisper, Edge-TTS, NLLB-200PythonDockerFastAPIPyTorchLLaMAPostgreSQL

Интересный факт

Проект использует трёхмиллиардную модель Qwen, которая помещается на обычном ноутбуке, но при этом даёт осмысленные ответы по документам — это редкий баланс между лёгкостью и качеством.

С чего начать

  • Установите Python 3.10+, Ollama и FFmpeg
  • Склонируйте репозиторий и установите зависимости

Оценка GitRadar

Удобство
6/10
Свежесть
8/10
Перспектива
7/10
Монетизация
6/10
Общая оценка
7/10

Вердикт GitRadar

Стоит попробовать, если нужен прототип мультиязычного ассистента с голосом. Архитектура продумана, есть Docker, но проект сыроват (30 звёзд, 0 форков) и требует ручной настройки Ollama и моделей.

Наблюдения по обновлениям

Проект выглядит живым: есть Docker, асинхронная архитектура, но мало звёзд и активности. Вероятно, это личный проект с амбициями на production.

Что мы проверили

Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.

Исходный репозиторий
https://github.com/Manoharesh/Multilingual_OpenSource_Chatbot
Создан на GitHub
28 марта 2026 г.
Последнее обновление репо
28 марта 2026 г.
Последняя проверка GitRadar
28 марта 2026 г.
Изученные файлы
ai/README.md, frontend/index.html, README.md, ai/app.py, requirements.txt, Dockerfile

FAQ

Что это такое?

Бэкенд для голосового ассистента, который отвечает на вопросы по документам на трёх языках, работает офлайн и стримит ответы.

Для кого подходит?

Для разработчиков, которые делают голосовые интерфейсы для госуслуг, банков или корпоративных справок в мультиязычных странах.

Источники

  • GitHub исходный код и активность
  • README описание, ссылки, стартовые материалы

Нужна помощь с Manoharesh/Multilingual_OpenSource_Chatbot?

Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.