Podczas pracy z dokumentami, zeskanowanymi książkami i plikami pdf często konieczna jest ich edycja. Aby to zrobić, musisz rozpoznać tekst w formacie pdf i przekonwertować go na format zwykłego tekstu. Można to zrobić na kilka sposobów.
Rozpoznaj tekst PDF
Dokumenty elektroniczne utworzone przez edytor tekstu są łatwo rozpoznawane przez bezpłatny program Adobe Reader. Otwórz wymagany plik PDF w programie, przejdź do menu „edytuj”, w rozwijanym oknie wybierz wiersz „skopiuj do schowka”. Utwórz nowy dokument w programie Word, wklej do niego tekst ze schowka i edytuj go, a następnie zapisz w wymaganym formacie.
Możesz także konwertować i edytować pliki PDF za pomocą wielofunkcyjnego narzędzia Acrobat Reader DC. Oprogramowanie zawiera dużą liczbę narzędzi do pracy z dokumentami elektronicznymi.
Są to dobre programy, ale nie będą w stanie rozpoznać tekstu, jeśli dokumenty pdf są chronione przed edycją lub zeskanowane z papieru. W takim przypadku potrzebujesz specjalnego programu OCR.
OCR
Niekwestionowanym liderem jest ABBYY FineReader, program rozpoznaje poszczególne strony i pracuje w trybie wsadowym. Przetworzony tekst można zapisać w formatach txt, doc, html i innych. Program dość dobrze rozpoznaje tekst pdf. Może występować niewielki procent błędnie rozpoznanych znaków i dokument będzie wymagał ręcznej korekty, wynik zależy od jakości skanów. Ten program ma jedną wadę - jest płatny.
Istnieją inne płatne i bezpłatne programy, które umożliwiają rozpoznawanie i konwertowanie tekstu z pdf na słowo: bezpłatne - CuneiForm, Freemore OCR, FreeOCR; płatne - Readiris Pro, Nitro PDF Professional.
Rozpoznaj tekst online
Jeśli nie konwertujesz codziennie dokumentów elektronicznych, wystarczy raz popracować z formatem PDF, w tym przypadku nie ma sensu instalować programu na komputerze. Istnieją usługi online dla takich odcinków. Wygodne jest również korzystanie z nich w pracy, w podróży, gdy w pobliżu nie ma komputera z zainstalowanym programem. Usługi online umożliwiają bezpłatne i szybkie rozpoznawanie tekstu. Oto niektóre:
- OCR online - www.onlineocr.net
- NewOCR - www.nedocr.com
- Darmowy-OCR - www.free-ocr.com
- OCRConvert - www.ocrconvert.com
Rozpoznawanie tekstu online ma wiele pozytywnych aspektów, ale są też wady: musisz zarejestrować się w usłudze; nie wszystkie usługi mają funkcję eksportu, rozpoznany tekst trzeba skopiować ze strony internetowej; niektóre usługi mają limit liczby przetwarzanych dokumentów; jakość efektu końcowego zależy od szybkości internetu.
Jak się okazało, rozpoznanie tekstu pdf nie jest trudne, istnieją różne programy, można wybrać dowolne.