У вас есть PDF-документ^{(PDF document)} или изображение, которое вы хотели бы преобразовать в текст? Недавно кто-то прислал мне по почте документ, который мне нужно было отредактировать и отправить обратно с исправлениями. Этот человек не смог найти цифровую копию, поэтому мне было поручено преобразовать весь этот текст в цифровой формат.

Я никоим образом не собирался часами вводить все обратно, поэтому в итоге я сделал красивую высококачественную фотографию документа, а затем пролистал кучу онлайн- сервисов OCR , чтобы увидеть, какой из них даст мне лучший результат. Результаты.

В этой статье я расскажу о нескольких моих любимых сайтах для OCR , которые бесплатны. Стоит отметить, что большинство этих сайтов предоставляют базовую бесплатную услугу, а затем имеют платные опции, если вам нужны дополнительные функции, такие как большие изображения, многостраничные документы в формате PDF^(PDF) , разные языки ввода и т. д.

Также хорошо знать заранее, что большинство этих сервисов не смогут соответствовать форматированию исходного документа. Они в основном для извлечения текста и все. Если вам нужно, чтобы все было в определенном макете или формате^{(layout or format)} , вам придется сделать это вручную, как только вы получите весь текст из OCR .

Кроме того, наилучшие результаты для получения текста дадут документы с разрешением от 200 до 400 DPI^{(DPI resolution)} . Если у вас изображение с низким DPI^{(DPI image)} , результаты будут не такими хорошими.

Наконец, я протестировал множество сайтов, которые просто не работали^{(t work)} . Если вы воспользуетесь бесплатным онлайн- распознаванием текста^(OCR) в Google , вы увидите множество сайтов, но некоторые из них в первой десятке результатов даже не завершили преобразование. У некоторых время ожидания истекло, другие выдавали ошибки, а некоторые просто зависали на странице «конвертации», так что я даже не удосужился упомянуть эти сайты.

Для каждого сайта я протестировал два документа, чтобы увидеть, насколько хорошими будут результаты. Для своих тестов я просто использовал свой iPhone 5S , чтобы сфотографировать оба документа, а затем загрузил их непосредственно на веб-сайты для конвертации.

Если вы хотите увидеть, как выглядели изображения, которые я использовал для своего теста, я прикрепил их сюда: Test1 и Test2 . Обратите внимание, что это не полноразмерные версии изображений, снятых с телефона. Я использовал изображение в полном разрешении^{(resolution image)} при загрузке на сайты.

OnlineOCR

OnlineOCR.net — чистый и простой сайт, который показал очень хорошие результаты в моем тесте. Главное, что мне в нем нравится, это то, что на нем нет кучи рекламы повсюду, как это обычно бывает с такими нишевыми сервисными^{(niche service)} сайтами.

бесплатно онлайн распознавание

Для начала выберите файл и подождите, пока^{(file and wait till)} он завершит загрузку. Максимальный размер загрузки для этого сайта составляет 100 МБ. Если вы зарегистрируете бесплатную учетную запись, вы получите несколько дополнительных функций, таких как больший размер загрузки, многостраничные PDF^(PDFs) -файлы , различные языки ввода, больше конверсий в час и т. д.

Затем выберите язык ввода,^{(input language)} а затем выберите формат вывода^{(output format)} . Вы можете выбрать Word , Excel или обычный текст^{(Plain Text)} . Нажмите кнопку^(Click) « Преобразовать^(Convert) », и вы увидите текст, отображаемый внизу в поле вместе со ссылкой для скачивания^{(download link)} .

вывод распознавания

Если вам нужен только текст, просто скопируйте и вставьте^{(copy and paste)} его из поля. Тем не менее, я предлагаю вам скачать документ Word^{(Word document)} , потому что он на удивление отлично сохраняет макет исходного документа.

Например, когда я открыл документ Word^{(Word document)} для своего второго теста, я был удивлен, обнаружив, что документ содержит таблицу с тремя столбцами, как на изображении.

вывод онлайн-распознавания

Из всех сайтов этот оказался лучшим. На него стоит зарегистрироваться, если вам нужно много конверсий.

Для полноты картины я также приведу ссылки на выходные файлы, созданные каждой службой, чтобы вы могли сами увидеть результаты. Вот результаты OnlineOCR : Test1 Doc и Test2 Doc^{(Test1 Doc and Test2 Doc)} .

Обратите внимание, что при открытии этих документов Word на вашем компьютере вы получите сообщение в Word о том, что это из Интернета и редактирование^{(Internet and editing)} отключено. Это совершенно нормально, потому что Word не^{(Word doesn)} доверяет документам из Интернета^(Internet) , и вам действительно не нужно разрешать редактирование, если вы хотите просто просмотреть документ.

i2OCR

Еще одним сайтом, который дал довольно хорошие результаты, был i2OCR . Процесс очень похож: выберите язык, файл и нажмите « Извлечь текст^{(Extract Text)} » .

i2ocr

Вам придется подождать минуту или две здесь, потому что этот сайт занимает немного больше времени. Кроме того, на шаге 2^{(Step 2)} убедитесь, что ваше изображение отображается правой стороной вверх в предварительном просмотре, иначе вы получите кучу тарабарщины на выходе. По какой-то причине изображения с моего iPhone отображались на моем компьютере в портретном режиме^{(portrait mode)} , но когда я загружал их на этот сайт, они были в альбомной ориентации.

вывод i2ocr

Мне пришлось вручную открыть изображение в приложении для редактирования фотографий, повернуть его на 90 градусов, затем повернуть обратно в портретное положение и снова сохранить. После^(Once) завершения прокрутите вниз, и он покажет вам предварительный просмотр текста вместе с кнопкой загрузки^{(download button)} .

Этот сайт неплохо справился с результатами первого теста, но не так хорошо справился со вторым тестом, в котором использовалось расположение столбцов^{(column layout)} . Вот результаты от i2OCR: Test1 Doc и Test2 Doc^{(Test1 Doc and Test2 Doc)} .

FreeOCR

Free-OCR.com возьмет ваши изображения и преобразует их в обычный текст^{(plain text)} . У него нет возможности экспортировать в формат Word^{(Word format)} . Выберите файл, выберите язык и нажмите « Пуск^(Start) » .

Сайт быстрый, и вы получите результат довольно быстро. Просто нажмите^{(Just click)} на ссылку, чтобы загрузить текстовый файл^{(text file)} на свой компьютер.

freeocr

Как и в случае с NewOCR , упомянутым ниже, на этом сайте все буквы Т в документе написаны с большой буквы. Я понятия не имею, почему это было сделано, но по какой-то странной причине этот сайт и NewOCR^{(site and NewOCR)} сделали это. Изменить его несложно, но это утомительный процесс, который вам действительно не нужно делать.

Вот результаты FreeOCR : Test1 Doc и Test2 Doc^{(Test1 Doc and Test2 Doc)} .

ABBYY FineReader онлайн

Чтобы использовать FineReader Online , вам необходимо зарегистрировать учетную запись, которая дает вам 15-дневную бесплатную пробную версию для распознавания^(OCR) до 10 страниц бесплатно. Если вам нужно сделать разовое распознавание^(OCR) только для пары страниц, то вы можете воспользоваться этой услугой. Убедитесь^(Make) , что вы щелкнули ссылку ^{(verify link)}подтверждения в электронном письме^{(confirmation email)} с подтверждением после регистрации.

FineReader онлайн

Нажмите « Распознать^(Recognize) » вверху, а затем нажмите « Загрузить^(Upload) » , чтобы выбрать файл. Выберите свой язык, выходной формат, а затем нажмите « Распознать^(Recognize) » внизу. У этого сайта чистый интерфейс и нет рекламы.

В моих тестах этот сайт смог получить текст из первого тестового документа^{(test document)} , но он был просто огромным, когда я открыл документ Word^{(Word doc)} , поэтому в итоге я сделал это снова и выбрал обычный текст^{(Plain Text)} в качестве выходного формата^{(output format)} .

Во втором тесте со столбцами документ Word^{(Word document)} был пуст, и я даже не смог найти текст. Не уверен, что там произошло, но, похоже, он не может обрабатывать ничего, кроме простых абзацев. Вот результаты FineReader : Test1 Doc и Test2 Doc.

НовыйOCR

Следующий сайт, NewOCR.com , был в порядке, но далеко не так хорош, как первый сайт. Во-первых, у него есть реклама, но, к счастью, не тонна. Сначала вы выбираете файл, а затем нажимаете кнопку « Предварительный просмотр^(Preview) ».

загрузить изображение

Затем вы можете повернуть изображение и настроить область, в которой вы хотите сканировать текст. Это очень похоже на то, как процесс сканирования^{(scanning process)} работает на компьютере с подключенным сканером.

распознавание изображений

Если в документе несколько столбцов, вы можете нажать кнопку Анализ макета страницы^{( Page layout analysis)} , и он попытается разделить текст на столбцы. Нажмите ^(Click)кнопку OCR^{(OCR button)} , подождите несколько секунд, пока она завершится, а затем прокрутите вниз, когда страница обновится.

В первом тесте он получил весь текст правильно, но по какой-то причине в документе каждая буква T была написана с большой буквы! Понятия не имею, зачем это было сделано, но это произошло. Во втором тесте с включенным анализом страницы^{(page analysis)} он получил большую часть текста, но макет был полностью отключен.

Вот результаты NewOCR : Test1 Doc и Test2 Doc.

Заключение

Как видите, бесплатное использование, к сожалению, в большинстве случаев не дает хороших результатов. Первый упомянутый сайт на сегодняшний день является лучшим, потому что он не только отлично распознал весь текст, но и сохранил формат исходного документа.

Однако, если вам просто нужен текст, большинство веб-сайтов, указанных выше, смогут сделать это за вас. Если у вас есть какие-либо вопросы, не стесняйтесь комментировать. Наслаждаться!

5 Free Online OCR Services Tested and Reviewed

Hаve a РDF documеnt or an image that you would like to convert to text? Recently, someone sеnt me a document in the mail that I needed to edit аnd send baсk with corrections. The person couldn’t locate a digital copy, so І was tasked with getting all that text into digital format.

There was no way I was going to spend hours typing everything back in, so I ended up taking a nice high-quality picture of the document and then burned my way through a bunch of online OCR services to see which one would give me the best results.

In this article, I’ll go through a couple of my favorite sites for OCR that are free. It’s worth noting that most of these sites provide a basic free service and then have paid options if you want extra features like bigger images, multi-page PDF documents, different input languages, etc.

It’s also good to know beforehand that most of these services will not be able to match the formatting of your original document. These are mainly for extracting text and that’s it. If you need everything to be in a specific layout or format, you’ll have to manually do that once you get all the text from the OCR.

In addition, the best results for getting the text will come from documents with a 200 to 400 DPI resolution. If you have a low DPI image, the results will not be as good.

Lastly, there were a lot of sites I tested that just didn’t work. If you Google free online OCR, you’ll see a bunch of sites but several of the sites in the top 10 results didn’t even complete the conversion. Some would time out, other would give errors and some just got stuck on the “converting” page, so I didn’t even bother to mention those sites.

For each site, I tested two documents to see how well the output would be. For my tests, I simply used my iPhone 5S to take a picture of both documents and then uploaded them directly to the websites for conversion.

In case you want to see what the images looked like that I used for my test, I have attached them here: Test1 and Test2. Note that these are not the full resolution versions of the images taken from the phone. I used the full resolution image when uploading to the sites.

OnlineOCR

OnlineOCR.net is a clean and simple site that delivered very good results in my test. The main thing I like about it is that it doesn’t have tons of ads all over the place, which is usually the case with these kinds of niche service sites.

free online ocr

To start, select your file and wait till it finishes uploading. The max upload size for this site is 100 MB. If you register for a free account, you get a few extra features like the bigger upload size, multi-page PDFs, different input languages, more conversions per hour, etc.

Next, choose your input language and then choose the output format. You can choose from Word, Excel, or Plain Text. Click the Convert button and you’ll see the text displayed at the bottom in a box along with a download link.

ocr output

If all you want is the text, just copy and paste it from the box. However, I suggest you download the Word document because it does a surprisingly great job of keeping the layout of the original document.

For example, when I opened the Word document for my second test, I was surprised to find that the document included a table with three columns, just like in the image.

online ocr output

Out of all the sites, this one was the best by far. It’s totally worth registering for if you need to do a lot of conversions.

For completeness, I am also going to link to the output files created by each service so you can see the results for yourself. Here are the results from OnlineOCR: Test1 Doc and Test2 Doc.

Note that when opening these Word documents on your computer, you’ll get a message in Word stating that it’s from the Internet and editing has been disabled. That is perfectly OK because Word doesn’t trust documents from the Internet and you really do not have to enable editing if you just want to view the document.

i2OCR

Another site that gave pretty good results was i2OCR. The process is very similar: choose your language, file, and then press Extract Text.

i2ocr

You’ll have to wait a minute or two here because this site takes a bit longer. Also, in Step 2, make sure that your image is showing right-side up in the preview, otherwise you’ll get a bunch of gibberish as output. For some reason, the images from my iPhone were showing in portrait mode on my computer, but landscape when I uploaded to this site.

i2ocr output

I had to manually open the image in a photo editing app, rotate it 90 degrees, then rotate it back to portrait and then save it again. Once complete, scroll down and it’ll show you a preview of the text along with a download button.

This site fared pretty well with the output for the first test, but didn’t do so well with the second test that had the column layout. Here are the results from i2OCR: Test1 Doc and Test2 Doc.

FreeOCR

Free-OCR.com will take your images and convert them into plain text. It does not have an option to export to Word format. Choose your file, select a language and then click Start.

The site is fast and you’ll get the output fairly quickly. Just click on the link to download the text file to your computer.

freeocr

As with NewOCR mentioned down below, this site capitalizes all the T’s in the document. I have no idea why it would do that, but for some odd reason this site and NewOCR both did this. It’s not a big deal to change it, but it’s a tedious process you really shouldn’t have to do.

Here are the results from FreeOCR: Test1 Doc and Test2 Doc.

ABBYY FineReader Online

In order to use FineReader Online, you have to register for an account, which gets you a 15-day free trial to OCR up to 10 pages for free. If you only need to do a one-time OCR for a couple of pages, then you can use this service. Make sure that you click the verify link in the confirmation email after you register.

finereader online

Click on Recognize at the top and then click Upload to select your file. Choose your language, output format and then click Recognize at the bottom. This site has a clean interface and no ads too.

In my tests, this site was able to grab the text from the first test document, but it was absolutely enormous when I opened the Word doc, so I ended up doing it again and choosing Plain Text as the output format.

For the second test with the columns, the Word document was empty and I couldn’t even find the text. Not sure what happened there, but it doesn’t seem to be able to handle anything other than simple paragraphs. Here are the results from FineReader: Test1 Doc and Test2 Doc.

NewOCR

The next site, NewOCR.com, was OK, but not nearly as good as the first site. Firstly, it’s got ads, but thankfully not a ton. You first select your file and then click the Preview button.

upload image

You can then rotate the image and adjust the area where you want to scan for text. It’s pretty much kind of like how the scanning process works on a computer with an attached scanner.

ocr image

If the document has multiple columns, you can check the Page layout analysis button and it will try to split the text up into columns. Click the OCR button, wait a few seconds for it to complete and then scroll down to the bottom when the page refreshes.

In the first test, it got all the text correctly, but for some reason capitalized every T in the document! No idea why it would do that, but it did. In the second test with page analysis enabled, it got most of the text, but the layout was completely off.

Here are the results from NewOCR: Test1 Doc and Test2 Doc.

Conclusion

As you can see, free doesn’t really give you very good results most of the time unfortunately. The first site mentioned is the best by far because not only did it do a great job of recognizing all the text, it also managed to retain the format of the original document.

If you just need text, though, most of the websites above should be able to do that for you. If you have any questions, feel free to comment. Enjoy!

Галина Набокова

About the author

Я инженер-программист с более чем двухлетним опытом работы с мобильными и настольными приложениями. У меня есть опыт работы с обновлениями Windows, службами и Gmail. Мои навыки делают меня идеальным кандидатом для таких задач, как разработка приложений для Windows или поддержка почтовых клиентов.

5 протестированных и проверенных бесплатных онлайн-сервисов OCR

OnlineOCR

i2OCR

FreeOCR

ABBYY FineReader онлайн

НовыйOCR

Заключение

5 Free Online OCR Services Tested and Reviewed

OnlineOCR

i2OCR

FreeOCR

ABBYY FineReader Online

NewOCR

Conclusion

Галина Набокова

About the author

Related posts

5 Best Sites, чтобы найти Online Tutor для Adults and Kids

Как слушать Radio Stations Online для Free

10 Best Sites для просмотра Cartoons Online для Free

6 сайтов для игры Retro Games Online для Free

Start Online Journal с этими 6 Best Websites и Apps

5 лучших онлайн-источников для покупки подержанных учебников

5 лучших бесплатных онлайн-инструментов для создания блок-схем

4 лучших сайта для просмотра Anime Online для Free

Топ 7 Sites смотреть Bollywood Movies Online Legally

Как записать себя онлайн с помощью веб-камеры

Как найти лучшие предложения в Интернете и сэкономить деньги при покупках

8 лучших сайтов для покупки покемонов, магии и других коллекционных карт онлайн

10 лучших онлайн-источников видео без лицензионных отчислений

16 Best Sites до Find Free Audiobooks Online

12 лучших онлайн-игр с квестами

7 лучших бесплатных онлайн-таймеров, которые стоит добавить в закладки

10 лучших интернет-магазинов дешевой электроники

Как найти дешевые авиабилеты онлайн и превзойти авиакомпании

10 лучших сайтов для печати цифровых фотографий онлайн

7 лучших аккредитованных онлайн-курсов для изучения компьютеров