← Все проекты
Проект / Python

superpilot69/pdf-trad-to-simp-preserve-layout-kit: PDF-конвертер с сохранением макета: традиционный китайский → упрощённый

Автоматически переводит PDF-документы с традиционного китайского на упрощённый, сохраняя исходный макет, изображения и текст.

Скрипты на Python обрабатывают PDF-файлы через PyMuPDF, заменяют текст с помощью библиотеки opencc, подбирают совместимые шрифты и могут заменять обложку-картинку отдельным скриптом, не трогая остальные страницы.

★ 70 Python Форки 11 Issue 0 Оценка 6/10 Карточка проверена

Для кого это

Для разработчиков, локализаторов и издателей, которым нужно адаптировать китайские PDF-документы для материкового Китая без ручного переформатирования.

Проблема / задача

Обычные конвертеры ломают вёрстку PDF при переводе иероглифов, заставляя тратить часы на восстановление макета.

Как это работает

Скрипты на Python обрабатывают PDF-файлы через PyMuPDF, заменяют текст с помощью библиотеки opencc, подбирают совместимые шрифты и могут заменять обложку-картинку отдельным скриптом, не трогая остальные страницы.

Что видно по README

Это готовый рабочий процесс для конвертации PDF с традиционного китайского на упрощённый. В репозитории есть примеры файлов, скрипты для установки зависимостей, конвертации текста, замены обложки и извлечения шрифтов из коллекций .ttc. Всё упаковано как навык для Codex.

Ключевые возможности

Конвертация текста с сохранением макета страницЗамена обложки-изображения без нарушения документаИзвлечение нужных начертаний из коллекций шрифтов .ttcГотовые примеры PDF для тестирования

Технологии

PythonPyMuPDFopencc-python-reimplementedfonttools

Интересный факт

Проект включает реальные примеры PDF-файлов до и после конвертации, чтобы сразу увидеть результат.

С чего начать

  • Клонируйте репозиторий
  • Запустите install_deps.sh для установки зависимостей
  • Выполните скрипт convert_pdf_t2s_preserve_layout.py с вашим PDF

Оценка GitRadar

Удобство
7/10
Свежесть
6/10
Перспектива
6/10
Монетизация
5/10
Общая оценка
6/10

Вердикт GitRadar

Стоит попробовать, если нужна автоматизация перевода китайских PDF. Это узкоспециализированный, но готовый к использованию набор скриптов.

Наблюдения по обновлениям

Проект выглядит законченным и стабильным, но активность низкая (0 issues). Это скорее архив готового решения.

Что мы проверили

Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.

Лицензия
NOASSERTION
Создан на GitHub
8 апреля 2026 г.
Последнее обновление репо
8 апреля 2026 г.
Последняя проверка GitRadar
8 апреля 2026 г.
Изученные файлы
README.zh-CN.md, README.md, skill/scripts/requirements.txt, skill/scripts/install_deps.sh, skill/scripts/extract_ttc_font.py, skill/scripts/replace_pdf_cover.py

FAQ

Что это такое?

Набор Python-скриптов для автоматического перевода PDF с традиционного китайского на упрощённый с сохранением вёрстки.

Для кого подходит?

Для разработчиков и локализаторов, работающих с китайскими документами и ценящих автоматизацию.

Источники

  • GitHub исходный код и активность
  • README описание, ссылки, стартовые материалы

Нужна помощь с superpilot69/pdf-trad-to-simp-preserve-layout-kit?

Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.