Что это такое?
Готовый Docker-сервис с API для автоматического скрытия персональных данных (имён, телефонов, email) в текстах на основе модели OpenAI.
Это готовый HTTP-сервис для обнаружения и скрытия персональных данных (PII), построенный на основе OpenAI Privacy Filter. Проект поставляется как Docker-образ с простым API, который можно запустить одной командой. Включает health-чек, поддержку GPU и...
Для разработчиков, которым нужно быстро добавить обезличивание текстов в свой продукт без глубокого погружения в машинное обучение.
При работе с пользовательскими данными нужно скрывать персональную информацию (PII), но писать собственные модели сложно, а готовые решения требуют настройки и интеграции.
Проект упаковывает модель OpenAI Privacy Filter в Docker-контейнер с FastAPI. При запуске загружается предобученная модель, которая умеет распознавать 19 типов персональных данных. Сервис предоставляет три эндпоинта: для обработки одного текста, только скрытого текста и пакетной обработки. Модель работает на CPU или GPU (CUDA).
Это готовый HTTP-сервис для обнаружения и скрытия персональных данных (PII), построенный на основе OpenAI Privacy Filter. Проект поставляется как Docker-образ с простым API, который можно запустить одной командой. Включает health-чек, поддержку GPU и возможность использовать кастомные модели.
Модель загружается при первом запуске 1-2 минуты — разработчик специально добавил health-чек со стартовой задержкой, чтобы сервис не принимал запросы до готовности.
Стоит попробовать, если нужен быстрый старт с обезличиванием текстов. Проект решает конкретную задачу «из коробки», но это всего лишь обёртка над официальной библиотекой OpenAI.
Проект скромный (12 звёзд), но готов к использованию. Docker-образ собран аккуратно, есть health-чек и логика graceful shutdown. Активность низкая — это обёртка, а не полноценный продукт.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Готовый Docker-сервис с API для автоматического скрытия персональных данных (имён, телефонов, email) в текстах на основе модели OpenAI.
Для разработчиков, которым нужно быстро добавить обезличивание текстов в свой сервис без обучения собственных моделей.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.