Что это такое?
Набор Python-скриптов для автоматического перевода PDF с традиционного китайского на упрощённый с сохранением вёрстки.
Скрипты на Python обрабатывают PDF-файлы через PyMuPDF, заменяют текст с помощью библиотеки opencc, подбирают совместимые шрифты и могут заменять обложку-картинку отдельным скриптом, не трогая остальные страницы.
Для разработчиков, локализаторов и издателей, которым нужно адаптировать китайские PDF-документы для материкового Китая без ручного переформатирования.
Обычные конвертеры ломают вёрстку PDF при переводе иероглифов, заставляя тратить часы на восстановление макета.
Скрипты на Python обрабатывают PDF-файлы через PyMuPDF, заменяют текст с помощью библиотеки opencc, подбирают совместимые шрифты и могут заменять обложку-картинку отдельным скриптом, не трогая остальные страницы.
Это готовый рабочий процесс для конвертации PDF с традиционного китайского на упрощённый. В репозитории есть примеры файлов, скрипты для установки зависимостей, конвертации текста, замены обложки и извлечения шрифтов из коллекций .ttc. Всё упаковано как навык для Codex.
Проект включает реальные примеры PDF-файлов до и после конвертации, чтобы сразу увидеть результат.
Стоит попробовать, если нужна автоматизация перевода китайских PDF. Это узкоспециализированный, но готовый к использованию набор скриптов.
Проект выглядит законченным и стабильным, но активность низкая (0 issues). Это скорее архив готового решения.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Набор Python-скриптов для автоматического перевода PDF с традиционного китайского на упрощённый с сохранением вёрстки.
Для разработчиков и локализаторов, работающих с китайскими документами и ценящих автоматизацию.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.