Что это такое?
Промежуточный слой для замены персональных данных на токены перед отправкой текстов в языковые модели. LLM видит только маски, а реальные значения хранятся у вас в зашифрованном виде.
Это Go-библиотека и HTTP-сервис для приватной обработки текстов перед отправкой к языковым моделям. Обнаруживает 10+ типов PII (номера карт, emails, имена, адреса, паспорта), работает полностью локально без отправки данных в облако, хранит маппинги в...
Для разработчиков, которые интегрируют LLM в продукты с обработкой пользовательских данных: чат-боты поддержки, анализ транскриптов, классификация документов.
При отправке пользовательских диалогов или документов в LLM вы невольно передаёте третьим сторонам реальные номера карт, телефоны, адреса и паспортные данные в открытом виде — это нарушает GDPR и создаёт риски утечек.
Проект работает как middleware между вашим приложением и LLM. Он анализирует текст, находит персональные данные с помощью локального запуска Ollama и регулярных выражений, заменяет их на непрозрачные токены и сохраняет соответствия в зашифрованном хранилище. LLM получает обезличенный текст, а при возврате ответа токены автоматически заменяются обратно на исходные значения.
Это Go-библиотека и HTTP-сервис для приватной обработки текстов перед отправкой к языковым моделям. Обнаруживает 10+ типов PII (номера карт, emails, имена, адреса, паспорта), работает полностью локально без отправки данных в облако, хранит маппинги в зашифрованном SQLite. Можно запустить через Docker Compose или встроить в своё Go-приложение.
Для обнаружения контекстных PII (имён, адресов, номеров паспортов) используется крошечная локальная LLM llama3.2:3b всего на 2 ГБ — она работает даже без GPU.
Стоит попробовать, если вы уже используете LLM с пользовательскими данными и беспокоитесь о compliance. Проект решает конкретную боль, архитектура продумана, но он очень молодой (11 звёзд, 0 форков) — для продакшена нужны тесты и аудит безопасности.
Проект активный, последние коммиты свежие, есть Docker-образ и подробная документация, но пока мало звёзд и нет issues — это либо очень нишевый инструмент, либо его ещё не нашли.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Промежуточный слой для замены персональных данных на токены перед отправкой текстов в языковые модели. LLM видит только маски, а реальные значения хранятся у вас в зашифрованном виде.
Для разработчиков на Go, которые внедряют LLM в продукты с обработкой диалогов поддержки, транскриптов звонков или документов с персональными данными.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.