Как редактировать PDF-файлы?

Обычно у меня есть две потребности:

Сценарий A. Измените одну страницу PDF.

В этом случае у меня есть PDF-файл, но нет исходного исходного файла, используемого для создания PDF-файла. Я не хочу пытаться воссоздать документ с нуля. Я бы хотел открыть PDF-файл и кое-что изменить. Хороший пример такого сценария: я отвечал за планирование большого мероприятия в кемпинге, у меня был PDF-файл сайта. Я хотел начать с этого документа, выделить некоторые части, добавить некоторые ярлыки, удалить некоторые части, которые не имели отношения к делу.

или

Сценарий B. Объединяйте PDF-файлы или извлекайте страницы из PDF-файла

Этот сценарий обычно возникает из-за того, что мне нужен единый результат в формате PDF, состоящий из частей, которые лучше всего создавать в разных программах. В этом случае у меня есть исходные файлы для всех документов, но они недостаточно хорошо сочетаются друг с другом, чтобы легко создать единый результат в формате PDF. Для части этого я, возможно, захочу использовать Libre Office Writer. Для другой страницы я, возможно, захочу использовать Gimp. Еще одна страница, на которой я могу использовать Libre Office Calc. Я мог бы использовать Writer в качестве основного документа и вставлять в него изображения или объект Calc, но для максимального контроля вы не можете превзойти отдельные PDF-документы, которые затем объединяются.

Каковы наилучшие инструменты / процессы для редактирования PDF-файлов в Ubuntu?

LibreOffice Draw

Это произвело на меня впечатление:

sudo apt-get install libreofficelibreoffice my.pdf

Просто откройте PDF-файл, отредактируйте и экспортируйте в формате PDF.

Инструменты редактирования отображаются на панели инструментов в нижней части окна (мне потребовалось некоторое время, чтобы найти его ...)

Соответствующий набор функций, который я нашел до сих пор (Ubuntu 13.04, LibreOffice 4.0.2.2):

  • Удаление страниц Щелкните правой кнопкой мыши на странице в списке страниц слева > Удалить страницу
  • Изменить порядок страниц: Перетаскивание страниц в списке страниц
  • Редактирование существующих текстовых полей (редактирование текста, форматирование и положение). Просто дважды щелкните с помощью инструмента выбора, чтобы перейти в режим редактирования.
  • Добавление новых текстовых полей. Выберите текстовый инструмент внизу (T), выделите нужную область текста и напишите.
  • Редактирование объектов нетекстовых полей как линии или пули.
  • Создание заполняемых PDF-форм (Включите панели инструментов Form* и обязательно выберите "Создать PDF-форму")

Я не смог найти чрезвычайно удобный метод выделения, но вам могло бы сойти с рук редактирование атрибутов текста, таких как установка красного цвета и выделение жирным шрифтом. Я не мог изменить цвет фона жестко.

Если я пропустил хорошие функции, пожалуйста, отредактируйте и добавьте их!

Вот скриншот того, как я редактирую PDF-файл, экспортированный из этого ODT: https://github.com/cirosantilli/media/blob/f3497274fffcb043b9751c903c9fe715a5b023ce/test.odt на 6.4.6.

enter image description here

Конечно, как вы можете видеть на скриншоте выше, PDF-файлы содержат не так много информации, как исходный ODT, и, например, я могу редактировать только одну видимую строку за один абзац, а следующие абзацы не будут "переноситься обратно" до правильного размера, поскольку PDF-файлы просто не предназначены для редактирования.

Примечание: Я знаю, что это не удается для нескольких типов PDF-файлов, это уже случилось со мной.

Если это так для вас, пожалуйста, откройте минимальный, супер подробный и воспроизводимый отчет об ошибке на их баг-трекере https://bugs.documentfoundation.org/ чтобы разработчики могли решить эту проблему и опубликовать ссылку в качестве комментария. Когда это случилось со мной, я был ленив / неопытен и не делал этого :-)

Несмотря на это, это все еще было лучшим открытым решением, когда я проверял в последний раз, и оно работает большую часть времени.

LibreOffice Draw у меня не работает, так как шрифты полностью перепутались, что затем приводит к отключению форматирования документа.

Вот три решения, которые для меня последовательно работали на протяжении многих лет.

PDF-shuffler

Я много комбинирую PDF-документы (как в сценарии B), и я нахожу PDF-shuffler простым и удобным. Я также использовал его для извлечения страниц из более крупного pdf-документа, и там он тоже хорошо работает. То PDF-shuffler Графический интерфейс прост и работает стабильно.

Gimp

Иногда для сценария А вы просто хотите преобразовать PDF-файл в изображение, а затем манипулировать изображением. Если вы не знаете разницы между векторной графикой и изображением, вы, вероятно, хотите преобразовать в изображение, и GIMP хорошо справляется с этим. Когда вы открываете PDF-файл с помощью GIMP, он предоставит вам несколько вариантов того, как вы хотите его преобразовать. Обратите внимание на опцию разрешения. Выберите большее число для большего размера файла и более детализированного изображения.

Чернильный пейзаж

Правда в том, что не существует супер простого способа редактировать PDF-файлы в соответствии со сценарием А, приведенным выше. Это связано с тем, что PDF является универсальным форматом, и часть структуры документа теряется при его преобразовании в PDF. Простой пример: если вы берете 3-страничный отчет и конвертируете его в PDF, вы нарушаете связи между текстом на каждой странице. Если вы отредактируете его PDF-версию и удалите абзац на первой странице, текст со страниц 2 и 3 не будет автоматически перенесен на первую страницу. Было бы намного проще отредактировать этот документ в исходной программе, использованной для его создания.

Но по какой-то причине у вас нет исходного документа, поэтому вы застряли в работе с PDF-файлом. Поэтому установите свои ожидания соответствующим образом при редактировании PDF-документа в соответствии со сценарием A.

Как только вы соответствующим образом настроите свои ожидания, вы увидите, что inkscape - лучший инструмент для большинства работ здесь. Это позволит вам импортировать одну страницу PDF-документа в виде векторной графики inkscape. Там будет несколько вещей, сгруппированных вместе, которые на самом деле не имеют смысла, и вам, возможно, придется изменить некоторые шрифты (при условии, что у вас не установлены оригинальные шрифты), но на самом деле это просто.

В Inkscape есть кривая обучения, но правда в том, что вы не можете манипулировать PDF без использования какой-либо программы с кривой обучения. Что касается моего времени, я бы предпочел потратить его на изучение Inkscape - отличного приложения для создания векторной графики, которое может пригодиться во множестве различных сценариев, - чем на то, чтобы попытаться выяснить, как использовать специальный инструмент только для редактирования PDF-файлов.

Удачи

Вы можете использовать последнюю версию Мастер-редактор PDF, который позволяет редактировать все элементы на странице.

Подсказка: Сначала попробуйте самую новую версию. Но, поскольку в последней версии 1.9.24, которую я пробовал, была ошибка, из-за которой не открывались все изображения pdf-файла, версия 1.9.00 работала очень хорошо, но единственный способ получить ее - это прямая ссылка:
http://code-industry.net/public/MasterPDFEditor-1.9.00.x86_64.tar.gz
http://code-industry.net/public/MasterPDFEditor-1.9.00.i386.tar.gz

Как упоминалось в комментариях, Master PDF Editor версии 4, который был последней бесплатной версией, которая не помещала водяной знак в PDF, удален с его веб-сайта, но доступен по адресуhttp://code-industry.net/public/master-pdf-editor-4.3.89_qt5.amd64.deb

Я немного опоздал в игре, но недавно наткнулся на этот вопрос, когда искал его в Google для себя. Как бы то ни было, я хотел бы рекомендовать Xournal для первого сценария.

Он должен быть в центре программного обеспечения, или вы можете просто запустить следующее с терминала:

sudo apt-get install xournal

Кроме того, я собираюсь поддержать рекомендацию всех остальных для pdfshuffler и pdftk для второго сценария.

Надеюсь, это поможет!

Я думаю, что PDF-Shuffler это небольшое, но довольно хорошее приложение.

Информация: PDF-Shuffler - это небольшое приложение на python-gtk, которое помогает пользователю объединять или разделять pdf-документы, а также поворачивать, обрезать и переставлять их страницы с помощью интерактивного и интуитивно понятного графического интерфейса. Это интерфейс для python-pyPdf.

Веб-сайт PDF-Shuffler

Редактор PDF Foxit (несвободный) хорошо работает через вино.

Более новые версии Фоксит может сработать и так - хотя я их еще не тестировал.

~.~.~

ps: Этот ответ относится к вашему "Сценарий А": вы можете в основном редактировать всё в pdf с Foxit: т.е. вы можете не только добавлять что-то, но и фактически редактировать их, как если бы это был, скажем, файл Word.

Там была волшебная штука под названием pdfправить в хранилище. В любом случае, вы можете получить его отсюда http://sourceforge.net/projects/pdfedit/. Я использовал его, чтобы внести некоторые текстовые изменения непосредственно в файл, опуская любые преобразования, так что структура файла остается нетронутой. Просто выберите режим выделения текста на панели инструментов и щелкните текст, который вы хотите отредактировать. Вам разрешено делать это через текстовое поле, которое появляется в верхнем левом углу окна. Конечно, есть гораздо больше возможностей.

PDF-Shuffler, который упоминался здесь, очень старый и имеет некоторые проблемы, так как он не обновлялся очень долгое время (с 2012 года). Чтобы исправить эти проблемы и добавить новые функциональные возможности, была создана вилка, называемая PDF-аранжировщик.

PDF Arranger

PDF Arranger - это бесплатное приложение с открытым исходным кодом для работы с PDF-документами, которое можно использовать для объединения, разделения, поворота и обрезки PDF-документов и изменения порядка их страниц с помощью интерактивного пользовательского интерфейса.

PDF Arranger доступен в Ubuntu 19.04 и новее и может быть установлен с помощью:

sudo apt install pdfarranger

Для более старых версий Ubuntu есть PPA для его установки (предоставляется Восстание Linux):

sudo add-apt-repository ppa:linuxuprising/appssudo apt updatesudo apt install pdfarranger

PDF-приятель это онлайн-редактор PDF, который является отличным решением для быстрого и простого кроссплатформенного редактирования PDF, независимо от того, используете ли вы Ubuntu или что-то еще. (Это пригодилось бы для того, что вы описываете в сценарии А)

(Раскрытие информации: я являюсь соучредителем PDF Buddy)

Я удивлен, что здесь не упоминается PDF Studio.

Это универсальное PDF-решение, которое может аннотировать, разметывать текст, заполнять формы, редактировать содержимое, подписывать, распознавать и управлять PDF-документами.

http://www.qoppa.com/pdfstudio

Не хотите ли добавить свой ответ сюда: gimp - Is there a better way to redact a PDF? - Ask Ubuntu и помечать это для закрытия как обман первого? Вы также можете немного отредактировать заголовок и вопрос с другой стороны. Это сделает вещи более последовательными и гарантирует, что информация находится в одном месте.

Я полностью за то, чтобы собрать воедино лучшую информацию, чтобы людям не приходилось ходить в 10 мест, чтобы получить ее… В этом случае, если я изменю этот вопрос на свой вопрос, другие комментарии и решения будут иметь мало смысла, не так ли?

Мы можем очистить его или, возможно, объединить другой пост с этим, если вы хотите, вы можете взглянуть и дать мне знать, что, по вашему мнению, было бы хорошим решением, я весь внимание.

У меня больше нет времени работать над этим сегодня, но будет завтра. Я опубликовал сообщение, чтобы помочь сообществу, и определенно не хочу вместо этого создавать еще больше путаницы с обманщиками. Я действительно чувствую, что другой вопрос (редактирование) - это очень конкретный вопрос, и многие ответы касаются вопросов, специфичных для редактирования (против модификации в целом). Я немного подумаю над этим, но я здесь новичок. Я рад последовать вашему совету. Так что дайте мне знать, как, по вашему мнению, лучше всего решить эту проблему. спасибо.

Я уберу его сегодня вечером, если вы увидите, что ваш пост по какой-то причине закрыт, пожалуйста, просто перенесите свой вопрос на другой. Его приятная информация и очень хорошо отформатированная, это действительно ценится. И не забывайте, мы можем отменить что-либо на сайте (большую его часть), так что, если вы не согласны, мы всегда можем что-то изменить или 2.

Что такое ярлык? Является ли это концепцией, связанной с pdf, или просто какой-то текст с заданными атрибутами в заданной позиции страницы?

How to take notes in PDFs in Linux - Super User, Xournal, very effective… How to take notes in PDFs in Linux - Super User

cirosantilli, то, что я имел в виду под “меткой” выше, - это последнее - некоторый текст в заданной позиции в PDF.