OXYGEN THIEF

Bardzo aktywny
Członek Załogi
Administrator
Dołączył
26 Maj 2010
Posty
39487
Reakcje/Polubienia
27889
Miasto
Trololololo
PDF OCR – to aplikacja do przekształcania zeskanowanych plików PDF w edytowalne pliki tekstowe. PDF OCR posiada wbudowany edytor tekstu, który pozwala na jego edycję.


Program posiada interfejs w języku angielskim.
http://programyzadarmo.net.pl/goto/166728
 

antbil007

Bardzo aktywny
Fąfel
Dołączył
11 Czerwiec 2010
Posty
5979
Reakcje/Polubienia
4366
Miasto
Polska
Serial działa z instalką ze strony producenta.
Plikiem absorbującym serial jest sound.dll z folderu głównego (warto zarchiwizować).
Przy reinstalce wystarczy go podmienić.
 

CarTon

Bardzo aktywny
Dołączył
10 Październik 2012
Posty
195
Reakcje/Polubienia
1
Miasto
19°57'E - 50°03'N
Faktycznie działa serial.
Dziękuję ci antbil007 za info. :dziękuję
Coś ostatnio mi antywirus blokuje instalki z GotD.
 

CarTon

Bardzo aktywny
Dołączył
10 Październik 2012
Posty
195
Reakcje/Polubienia
1
Miasto
19°57'E - 50°03'N
Już od trzech lat korzystam z G Data InternetSecurity, nigdy mi nie blokował instalek z GotD. Pliki pobierają i wypakowują się bez problemu, lecz gdy chcę uruchomić plik "Setup" pojawia się informacja iż miała miejsce próba dostępu do zarażonego pliku i nie mam możliwości zaakceptowania procesu. Tylko kwarantanna, zablokowanie lub usunięcie. W przypadku ostatniej promocji "Retouch Pilot 3.5.3" chodzi o plik "pih.dll" który pojawia się w folderze "Temp". Problem dotyczy tylko GotD.
Za kilka dni kończy mi się licencja na G Data. Być może zmienię na jakieś darmowe oprogramowanie.
 

OXYGEN THIEF

Bardzo aktywny
Członek Załogi
Administrator
Dołączył
26 Maj 2010
Posty
39487
Reakcje/Polubienia
27889
Miasto
Trololololo
CarTon napisał:
Już od trzech lat korzystam z G Data InternetSecurity, nigdy mi nie blokował instalek z GotD. Pliki pobierają i wypakowują się bez problemu, lecz gdy chcę uruchomić plik "Setup" pojawia się informacja iż miała miejsce próba dostępu do zarażonego pliku i nie mam możliwości zaakceptowania procesu. Tylko kwarantanna, zablokowanie lub usunięcie. W przypadku ostatniej promocji "Retouch Pilot 3.5.3" chodzi o plik "pih.dll" który pojawia się w folderze "Temp". Problem dotyczy tylko GotD.
Za kilka dni kończy mi się licencja na G Data. Być może zmienię na jakieś darmowe oprogramowanie.


Skoro problem dotyczy GOTD to zgłoś do producenta antywirusa to i naprawią czyli dodadzą do wykluczeń.
 

Bronco

Bardzo aktywny
Dołączył
17 Październik 2011
Posty
184
Reakcje/Polubienia
13
Program ten ma wbudowane jedynie następujące pliki języków:

angielski, francuski, niemiecki, starogermański, włoski, holenderski (Dutch), hiszpański, portugalski.

Brak jest języka polskiego, czyli w wersji oryginalnej od producenta do PDF-ów z polskim tekstem nie nadaje się ten program.

Na szczęście można jednak przysposobić PDF OCR 4.3.1 do obsługi polskich tekstów :)

Na początek więc wchodzimy na tę stronę:


Zaloguj lub Zarejestruj się aby zobaczyć!

Ściągamy z niej pliki z poniższych linków:

Zaloguj lub Zarejestruj się aby zobaczyć!
Czyli są to następujące pliki:

pol.DangAmbigs - 648 B
pol.freq-dawg - 5,80 kB
pol.inttemp - 1,38 MB
pol.normproto - 28,60 kB
pol.pffmtable - 1,47 kB
pol.unicharset - 2,33 kB
pol.word-dawg - 2,63 MB
pol.user-words - 0 B - Uwaga! - Ten plik, w razie czego, gdy nie uda nam się go ściągnąć, możemy utworzyć samemu z pustego pliku tekstowego o nazwie: pol.user-words.txt. Likwidujemy rozszerzenie .txt i mamy gotowy plik.

Gdy już mamy te pliki na dysku twardym, to zmieniamy ich przedrostek na język, z którego nie będziemy korzystać, czyli np. zmieniamy z pol na nld (Niderlandy - Holandia), czyli przykładowo:
pol.DangAmbigs zamieniamy na : nld.DangAmbigs

Tak zmienione pliki wklejamy do tego folderu:

C:\pdfOCR\tessdata

albo, jeśli w tym miejscu zainstalowaliśmy program:

C:\Program Files\pdfOCR\tessdata

Od tego momentu możemy konwertować tym programem metodą OCR polskie teksty :)

W tym przypadku wybieramy w tym programie język konwertowania metodą OCR: holenderski, czyli:
Language: Dutch

Przy okazji.

Normalnie tutaj zapisują się pliki skonwertowane metodą OCR:

C:\PDFOCR_Output

Program w miarę dobrze wykorzystuje metodę OCR dla plików PDF w języku polskim, w których tekst nie jest w kolumnach.

Dziękuję za uwagę - pozdrawiam :francuz
 

OXYGEN THIEF

Bardzo aktywny
Członek Załogi
Administrator
Dołączył
26 Maj 2010
Posty
39487
Reakcje/Polubienia
27889
Miasto
Trololololo

yyy

Bardzo aktywny
Zasłużony
Dołączył
12 Maj 2013
Posty
535
Reakcje/Polubienia
414
Ostatnia edycja:
Do góry