Что это такое?
Инструмент для перевода PDF, который сохраняет оригинальную вёрстку, формулы и структуру документа.
RetainPDF — это open‑source инструмент для перевода PDF‑документов с сохранением оригинальной вёрстки. Проект ориентирован на научные статьи, сканированные книги и технические руководства. Вместо простого извлечения текста он анализирует координаты блоков,...
Для исследователей, студентов, технических писателей и разработчиков, которым нужно работать с англоязычной документацией без потери читаемости.
Обычные переводчики PDF ломают вёрстку: формулы съезжают, двухколоночная структура исчезает, код и команды переводятся некорректно, а итоговый документ выглядит как бессвязный текст.
Система загружает PDF, распознаёт текст и структуру через OCR (поддерживает MinerU), переводит содержимое с помощью LLM (например, DeepSeek), а затем встраивает перевод обратно в исходный макет — подбирает размер шрифта, сохраняет позиции формул, обрабатывает таблицы и сжимает графику.
RetainPDF — это open‑source инструмент для перевода PDF‑документов с сохранением оригинальной вёрстки. Проект ориентирован на научные статьи, сканированные книги и технические руководства. Вместо простого извлечения текста он анализирует координаты блоков, формулы, код и двухколоночную структуру, чтобы после перевода документ выглядел так же, как оригинал. Доступны веб‑интерфейс, API и десктоп‑версии для Windows,...
Проект не просто режет PDF на куски, а работает с координатной сеткой документа — перевод вставляется точно в те же места, где был оригинальный текст, включая мелкие надписи на графиках.
Стоит попробовать, если вам нужен перевод сложных PDF с формулами и кодом. Проект активно развивается, но требует настройки API‑ключей для OCR и переводчика.
Проект активно развивается: видна структурированная кодовая база, частые коммиты, поддержка нескольких OCR‑провайдеров и экспорт в Typst.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Инструмент для перевода PDF, который сохраняет оригинальную вёрстку, формулы и структуру документа.
Для исследователей, студентов и разработчиков, которые работают с англоязычными научными статьями, мануалами или сканированными книгами.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.