Poppler Utils — это набор командных утилит для работы с PDF-файлами на основе библиотеки Poppler. Вот несколько основных утилит из этого пакета:
pdftotext:
Эта утилита используется для извлечения текста из PDF-файла и сохранения его в текстовом формате. Пример использования:
pdftotext input.pdf output.txt
Эта команда извлечет текст из файла input.pdf и сохранит его в файл output.txt.
pdfimages:
Эта утилита извлекает изображения из PDF-файла и сохраняет их в отдельные файлы. Пример использования:
pdfimages input.pdf output_prefix
Эта команда извлечет изображения из файла input.pdf и сохранит их с префиксом output_prefix.
pdftohtml:
Эта утилита конвертирует PDF-файл в HTML-формат. Пример использования:
pdftohtml input.pdf output.html
Эта команда создаст HTML-файл (output.html) на основе содержимого PDF-файла (input.pdf).
pdftocairo:
Эта утилита использует Cairo для конвертации PDF в различные форматы изображений, такие как PNG, JPEG, и другие. Пример использования:
pdftocairo -png input.pdf output.png
Эта команда конвертирует PDF-файл input.pdf в PNG-изображение output.png.
Установка Poppler Utils
Установка Poppler Utils может различаться в зависимости от вашей операционной системы.