Как скопировать текст из файла PDF

Если вы хотите скопировать текст из файла PDF , чтобы добавить его в документ Word , вставить формулу в электронную таблицу Excel или вставить в слайды PowerPoint для презентации, это может быть так же просто, как использование функции « Копировать(Copy) и вставить(Paste) » .

Однако это может не сработать для всех PDF -файлов из-за безопасности и других разрешений, но есть и другие способы выполнить ту же задачу.

Как скопировать текст из PDF(How to Copy Text From a PDF)

Прежде чем вы сможете копировать текст из PDF в другое приложение, вам нужно убедиться, что в нем нет настроек безопасности, запрещающих копирование, иначе вы ничего не сможете скопировать. На это может указывать серая или затемненная функция копирования в Reader .

Если полученный PDF-файл защищен паролем(protected by a password) , используйте указанную комбинацию паролей, чтобы открыть его, а затем проверьте настройки безопасности, чтобы подтвердить, что копирование содержимого разрешено.

  • Для этого щелкните документ правой кнопкой мыши и выберите Свойства документа(Document Properties) .

  • Перейдите на вкладку « Безопасность(Security ) » и просмотрите сводку ограничений документа(Document Restrictions Summary) , чтобы узнать, разрешено ли копирование содержимого.

Примечание(Note) . PDF -файлы с ограничениями содержимого обычно имеют слово «Защищено» рядом с именем файла вверху. 

  • Откройте PDF -файл в любой программе для чтения, а затем скопируйте нужный текст любым из приведенных ниже способов.

Существует несколько способов копирования текста из PDF - файла, которые мы рассмотрим в этом руководстве. 

Функция копирования и вставки(Copy & Paste Function)

Это де-факто метод копирования текста из большинства документов или файлов, а не только из PDF(PDFs) -файлов . Вы можете использовать сочетание клавиш CTRL+C , чтобы скопировать нужный текст, а затем использовать CTRL+V , чтобы вставить его в другой документ(paste it onto the other document)

Если вы используете Mac, нажмите Command-C , чтобы скопировать текст, и Command-V , чтобы вставить содержимое буфера обмена(Clipboard) в текущий документ или приложение.

Кроме того, вы можете использовать правую кнопку мыши или сенсорной панели и щелкнуть инструмент «Выбор(Select tool) » . 

Выберите текст, который вы хотите скопировать в PDF - документ, перетащив мышь, чтобы выделить часть, которую вы хотите скопировать, щелкните правой кнопкой мыши выделенный текст и выберите « Копировать(Copy) » .

Вы также можете перейти на вкладку меню и нажать « Edit>Copy . После того, как он скопирован, перейдите к документу, в который вы хотите вставить скопированный текст, щелкните правой кнопкой мыши место, куда вы хотите его поместить, и выберите « Вставить(Paste) » или нажмите « Edit>Paste .

 Инструмент создания снимков или скриншотов(Snapshot Or Screenshot Tool)

Инструмент «Снимок» в программе чтения PDF(PDF reader) -файлов помогает выбрать нужный текст в виде снимка экрана или изображения, а затем вставить его в другой документ, не затрагивая форматирование. Если вы выберете этот метод, вы получите именно ту часть текста, которую хотите, но ее нельзя будет редактировать.

Для этого откройте PDF - документ, нажмите Edit > Take a snapshot .

Либо выберите строку заголовка окна PDF и нажмите (PDF)Alt+PrtScn на клавиатуре, чтобы сделать снимок экрана(capture the screen) , а затем обрежьте его в соответствии с желаемой частью.

Если вы используете Mac, нажмите Command+Shift+4 и используйте курсор на экране, чтобы перетащить и выбрать текст, который вы хотите захватить.

Онлайн-читатель PDF(Online PDF Reader)

Вы можете скопировать текст из PDF - документа в браузере или онлайн-ридере.

Для этого откройте PDF -файл в браузере, щелкнув файл правой кнопкой мыши и выбрав « Open With > (choose browser) , или перетащите его в открытое окно браузера. 

Выберите нужный текст. Нажмите CTRL+C , чтобы скопировать текст и вставить его в другой документ с помощью CTRL+V . Вы также можете щелкнуть правой кнопкой мыши или сенсорной панелью и выбрать « Копировать(Copy) », а затем снова щелкнуть правой кнопкой мыши другой документ и выбрать « Вставить(Paste) » .

Программное обеспечение для извлечения PDF-файлов

Сторонний инструмент для извлечения PDF - файлов также может помочь вам извлечь текст для использования в другом приложении, таком как Word , презентация PowerPoint или программное обеспечение для настольных издательских систем.  

Вы можете использовать такой инструмент, как ExtractPDF , загрузить PDF -файл и нажать « Пуск(Start) » . Инструмент будет извлекать изображения, текст или даже шрифты, если вы хотите, после чего вы можете скопировать то, что хотите, из извлеченного содержимого и вставить его в другое приложение.

Существует множество сторонних инструментов извлечения(third-party extraction tools) PDF -(PDF) файлов, которые конвертируют их в HTML , сохраняя макет страницы. Они также извлекают и преобразуют содержимое документа PDF в форматы векторной графики, которые можно использовать в других приложениях.

Конвертер PDF(PDF Converter)

Конвертер PDF позволяет преобразовать документ PDF в редактируемый документ(convert a PDF document into an editable document) , после чего вы можете скопировать свой текст и использовать его в другом приложении.

Одним из популярных конвертеров PDF является SmallPDF , потому что это онлайн-инструмент, поэтому он не требует установки и прост в использовании. Чтобы использовать его, откройте SmallPDF в своем браузере, выберите выходной формат, например PDF в Word(PDF to Word) .

Нажмите « Выбрать файл(Choose file) », чтобы загрузить PDF -файл , который вы хотите преобразовать.

Нажмите « Загрузить(Download) », чтобы сохранить преобразованный файл на своем устройстве. Затем откройте преобразованный документ Word и скопируйте нужный текст.

Инструмент оптического распознавания символов(OCR Tool)

Инструмент оптического распознавания символов (OCR)(Optical Character Recognition (OCR) tool) позволяет преобразовывать PDF -файл в редактируемый документ Word , копировать текст из PDF -файлов и отсканированных изображений в редактируемые текстовые форматы.

Это особенно полезно, если вы получили отсканированный документ в формате PDF , поскольку он мгновенно превращает такие файлы в редактируемые PDF(PDFs) -файлы с пользовательскими шрифтами и редактируемым текстом, которые выглядят так же, как в исходном документе.

Adobe Acrobat работает как конвертер текста с OCR , поскольку он автоматически извлекает текст из отсканированных изображений или бумажных документов и преобразует их в PDF(PDFs) -файлы .

Самое приятное то, что ваш PDF -файл будет соответствовать исходной распечатке благодаря автоматической генерации пользовательского шрифта(custom font generation) , и вы можете использовать его с другими приложениями Office , вырезая и вставляя или экспортируя в MS-Office . Это также позволяет сохранить точный внешний вид документа и ограничить редактирование содержимого.

Примечание(Note) . Для выполнения этих шагов вам потребуется Adobe Acrobat , а не Adobe Reader , поскольку последний предназначен только для просмотра PDF(PDFs) -файлов и не имеет инструмента  OCR .

Чтобы использовать собственный инструмент OCR в (OCR)Adobe Acrobat , откройте PDF -файл , содержащий отсканированный текст или изображение, в Acrobat для ПК или Mac и нажмите « Редактировать PDF»(Edit PDF) .

Acrobat автоматически применит OCR к PDF -файлу и преобразует его в полностью редактируемую копию. Выделите текст, который хотите скопировать, и нажмите « Edit>Copy », затем вставьте его в другое приложение.

Вы можете нажать « File > Save As , чтобы сохранить редактируемый документ для последующего использования.

Либо откройте отсканированный документ или изображение, с которым вы хотите использовать программу чтения OCR , нажмите « (OCR)Инструменты(Tools ) » в правом верхнем углу панели инструментов и выберите « Recognize Text > In This File .

Вы увидите всплывающее окно с текущими общими настройками, такими как язык OCR , стиль вывода PDF и разрешение. Нажмите (Click) OK , чтобы текст был распознан.

Если вы хотите изменить настройки, нажмите « Изменить(Edit) » , а затем нажмите «ОК», когда закончите.

Как только текст распознан на отсканированной странице, вы можете выбрать и скопировать нужный текст с обнаруженным форматированием, хотя это не так точно, как распознавание текста.

Если все, что у вас есть, это Adobe Reader и вы не хотите получать копию Acrobat , есть бесплатные инструменты OCR , такие как (OCR)OneNote OCR(OneNote’s OCR) для ПК, который можно использовать бесплатно, или библиотека Tesseract OCR(Tesseract OCR library) для Mac. 

Примечание.(Note:) Если у вас есть Adobe Acrobat , вы можете распознавать несколько документов одновременно. Просто(Just) откройте любой документ в Acrobat , нажмите « Распознать текст(Recognize Text) » на боковой панели « Инструменты(Tools ) » и выберите « В нескольких файлах»(In Multiple Files) . Перетащите нужные PDF - файлы в OCR ,   и Acrobat распознает текст за вас.

Есть ли у вас какие-либо другие приемы, которые вы используете для копирования текста из файла PDF ? Расскажите(Tell) нам об этом в комментарии ниже.



About the author

Я инженер-программист с более чем двухлетним опытом работы с мобильными и настольными приложениями. У меня есть опыт работы с обновлениями Windows, службами и Gmail. Мои навыки делают меня идеальным кандидатом для таких задач, как разработка приложений для Windows или поддержка почтовых клиентов.



Related posts