Pretvoriti PDF dokument v Word

Pretvorba PDF dokumentov v Word (Excel) je zelo pogosta želja uporabnikov in nekaj zakar se velikokrat obračate name.

Da bi ne zašel v prevelike podrobnosti naj samo povem, da v splošnem pretvorba iz PDF v nekaj drugega ni možna. Seveda obstaja program podjetja Adobe (to je podjetje, ki je postavilo PDF standard), ki je neverjetno drag in v principu omogoča tudi omenjene konverzije a ob tem obstajajo sledeče težave:

  1. Program je zelooo drag
  2. PDF format je že tako zlorabljen, da nekaterih dokumentov tudi takšen program ne more pretvoriti v enakovreden Word format (poruši se oblika)
  3. …in še kaj bi se našlo ;)…

Rešitev 1

Če torej odpade tista najboljša in najdražja rešitev moramo poseči po čem drugem in najlepše ter najlažje je, da v PDF dokumentu označimo celotno vsebino in jo prekopiramo v Word – seveda izgubimo obliko – tu ni kaj – a imamo vsaj vsebino in je ni potrebno prepisovati.

Rešitev 2

Mnogokrat pa se teksta iz PDF dokumenta ne da pridobiti (pa ne govorim tukaj nujno o zaščitenih dokumentih, katerih vsebine ni dovoljeno kopirati!) – tukaj je govora o čisto navadnih PDF dokumentih, ki jih proizvaja tisoče in tisoče različnih programov, a so slednji sestavljeni tako, da namesto teksta ob kopiranju dobite samo vprašaje oz. neberljive znake. In kaj sedaj?

No, v tem primeru pa lahko uporabite tehniko OCR (Optical Character Recognition) oz. tehniko strojne pretvorbe slik v besedilo. V splošnem bi to izgledalo takole: Natisnete PDF, liste z optičnim bralnikom (scanner) preberete v obliki slik in te slike obdelate z OCR programom, ki iz njih izlušči tekst.

Kot vidite smo šli pravzaprav iz dežja pod kap, saj bi morali sedaj najprej celoten dokument natisniti, potem kupiti optični bralnik in liste prebrati nazaj v računalnik ter nato uporabiti še neskončno drag OCR program da slike pretvorimo v besedilo.

No verjetno sumite, da bi bloga ne pisal, če bi ne obstajala krajša in cenejša (beri zastonj) pot. Pot skrajšamo, če namesto tiska in branja dokumentov nazaj preprosto direktno pretvorimo PDF v sliko in namesto zelo dragega OCR programa uporabimo zastonj spletne rešitve.

Pretvorbo PDF dokumenta v sliko lahko opravite tukaj http://docupub.com/pdfconvert/, zastonj optično branje pa tukaj: http://www.free-ocr.com/ Pa veselo na delo! :):)

Ah da; kot vidite lahko na takšen način preprosto zaobidete tudi zaščito dokumentov, kar pomeni, da lahko na takšen način kradete – namen tega nasveta nikakor ni slednje – torej namen tega zapisa ni kraja temveč pretvorba dokumentov, za katere imate pravico to početi, a so slednji zapisani tako, da tega pač drugače ne omogočajo!

Komentirajte prispevek

This site uses Akismet to reduce spam. Learn how your comment data is processed.