Normaali aihe OCR tekstinlukijat (Luettu 4580 kertaa)
IlpoJaakko
God Member
*****
Poissa


SRHS

Viestejä: 819
OCR tekstinlukijat
17.08.2016 klo 10:34:00
Tulosta viesti  
Kiinostaisi hankkia joku OCR-ohjelma. Esim Adobe mainostaa PDF:n käsittelyyn ohjelmaa, jossa mukana tuo tekstintunnistus.
Kuinkahan se selviää ääkkösistä. Jenkkejä ei oikein vieläkään kiinnosta nämä eurooppalaisten ihmeelliset koukerot.

Joitakin ilmaisohjelmia myös netissä, mutta käyttöliittymät ja asentaminen ei mitenkään käyttäjäystävällisiä. Eräskin aiheutti virushälytyksen, joten oli siivottava kiiereesti pois.

Pitäisi päästä edes kokeilemaan, ettei osta sikaa säkissä.

IlpJaakko
  
Sivun alkuun
 
IP kirjattu
 
HarO
God Member
*****
Poissa


SRHS

Viestejä: 1031
Re: OCR tekstinlukijat
Vastaus #1 - 17.08.2016 klo 15:27:14
Tulosta viesti  
Ihan kevyehkönä kommenttina aiheeseen. Varmaankin kymmenen vuotta sitten käsiin tuli jostain Abbyyn Fine Reader, mahdollisesti jonkin skannerin kylkiäisenä. Se tuntui ihan vakuuttavalta ja ääkkösille oli oma lisäpakettinsa. Pari vuotta sitten viimeksi käytin ihan tuoretta OmniPagea ja täytyy sanoa, että tuotti pettymyksen, mitään kehitystä en havainnut lukutarkkuudessa tuohon vanhaan kokemukseen (ja testeihin samalla materiaalilla) verrattuna, osa dokumenteista oli ilmeisesti painojäljeltä niin pientä ja suttuista, paperi erittäin huonolaatuista, että tuloksena oli tavaraa, jonka oikoluku vei enemmän aikaa kuin kaiken kirjoittaminen uudestaan käsin. Ja kyllä, mainittu materiaali oli skannattu erinomaisen riittävällä tarkkuudella. Eli kokeilemaan todellakin pitäisi päästä ennen hankintaa.

H.
  

Joka hetki on poikkeus - S. Paronen
Sivun alkuun
 
IP kirjattu
 
IlpoJaakko
God Member
*****
Poissa


SRHS

Viestejä: 819
Re: OCR tekstinlukijat
Vastaus #2 - 18.08.2016 klo 20:06:42
Tulosta viesti  
Adobe Acrobat Pro x ladattu. Kokeiluversio 7:n päivän ajan. Yllättävän nopea, vain muutama sekunti/sivu. Käyttis Win 10. Jälki myös kelvollista. Käsikirjassa 505 sivua, joten ei varmaan opi koskaan sen kaikkia temppuja.
  
Sivun alkuun
 
IP kirjattu
 
RistoKoo
Full Member
***
Poissa


SRHS

Viestejä: 160
Re: OCR tekstinlukijat
Vastaus #3 - 19.08.2016 klo 07:25:57
Tulosta viesti  
  
Sivun alkuun
 
IP kirjattu
 
HarO
God Member
*****
Poissa


SRHS

Viestejä: 1031
Re: OCR tekstinlukijat
Vastaus #4 - 19.08.2016 klo 14:15:47
Tulosta viesti  
Pitää tuo Iriskin ehtiessä kokeilla, vaikka epäilenkin, ettei se Omnipagea päihitä, eli edelleen jää aineistoni kuvamuotoiseksi. Kun nyt edes sisällysluettelot (esimerkiksi) noista saisi tekstiksi. Kotiseutukuvauksia Lounais-Hämeestä on tuo mainittu julkaisusarja. Toki edistyneitä softia voi opettaa, mutta kenellä siihen on oikeasti aikaa ja pinnaa!

H.
  

Joka hetki on poikkeus - S. Paronen
Sivun alkuun
 
IP kirjattu
 
VjpA
God Member
*****
Poissa


SRHS

Viestejä: 2404
Sijainti: Vantaa
Re: OCR tekstinlukijat
Vastaus #5 - 20.08.2016 klo 23:06:15
Tulosta viesti  
Mulla ei ole Linuksissa Adobea, mutta .pdf tiedostot aukeaa Okular-nimisellä katselimella. Siinä on sellainen ominaisuus; kun maalaat hiirellä jonkun alueen tiedostosta - voit valita kopiotko tekstinä vai kuvana ja liität sen (tekstin) LibreOffice tekstinkäsittely dokkiin, niin siinä on sitten teksti oletusfontilla jatkokäsittelyä varten.

Ainakin Canonin skanneri-printtereissä tuli ennen OCR- ohjelma mukana (Win - Mac) ja sillä sai kyllä kuvasta tekstit luettua, vaan jos kuvassa oli/on vähän pikseleita lukijalla on vaikeuksia sekä jos fontti on vanhaa (esim. ennen WW II) tulee lukuvirheitä.
Kopioin vanhoista urheilulehdistä (1901 - 1904) juttua 240 pikseli kuviin, aika paljon joutui tekstiä editoimaan.
Linux:iin en ole vielä asentanut ko- ohjelmaa - niitä kyllä löytyy.
  

t. // Jukka
Sivun alkuun
 
IP kirjattu
 
IlpoJaakko
God Member
*****
Poissa


SRHS

Viestejä: 819
Re: OCR tekstinlukijat
Vastaus #6 - 22.08.2016 klo 13:10:54
Tulosta viesti  
Kokeilen juuri tuota RistoKoon antamaa linkkiä Readiris 15.

Katselin tarkemmin tuota Adoben OCR-ohjelmaa. Sen voi kyllä unohtaa, koska hinnan lisäksi tulisi vuosimaksukin.

Nyt kokeilen toista, Canonin Readiris15, jolta hain 10 päivän kokeiluversion. Hinta 79 €, eikä muita maksuja(?). Se tekee tekstiä myös kuvatiedostoista jpeg, Tiff ym. Ei tarvitse kaikkea skannata ensin PDF:ksi. Tuntuu toimivan ihan ok.  Siis Adobeen verrattuna kätevämpi.
Lisäksi siinä myös PDF-tiedostojen muokkausmahdollisuus. Tutkin onnistuuko se, kun joissakin PDF:ssä on laitettu suojauksena muokkauskielto.
  
Sivun alkuun
 
IP kirjattu
 
RJL
God Member
*****
Poissa


SRHS 612

Viestejä: 2594
Re: OCR tekstinlukijat
Vastaus #7 - 22.08.2016 klo 13:34:54
Tulosta viesti  
Muokkauskiellon voi poistaa tällä sivulla:

http://www.pdfunlock.com/

Pdf vaan lähetetään sinne ja takaisin omalle tietsikalle tulee avattu pdf.
  

Reijo Liljedahl - SRHS 612 - OH3AVA - SDXL 8092
Sivun alkuun
 
IP kirjattu
 
HarO
God Member
*****
Poissa


SRHS

Viestejä: 1031
Re: OCR tekstinlukijat
Vastaus #8 - 01.05.2024 klo 16:17:10
Tulosta viesti  
Mainitaan tähänkin vielä, että hiljattain havaitun perusteella NAPS2 toimii ihan hyvin, ainakin jos raakamateriaali on säädyllisen selkeätä. Itse tein juuri pienen kirjasen skannatuista sivuista nk. haettavan PDF:n ilman ongelmia. Suomen kieli tuettu siis myös, mitään asennuksiakaan ei väkisin tarvita, portable-paketista purku hakemistoon. Ilmaisohjelmien arvostelussa miinusta on annettu hitaalle OCR-toiminnolle, mutta en kyllä huomannut minkäänlaista ongelmaa tässä noin 50 sivun kirjasessa, jossa pieni määrä kuvia - valmis alle (EDIT:) 15 sekunnissa. Uskoisin skaalautuvan aika lineaarisesti laajempiinkin teoksiin. Vehje Ryzen 5 3600 ja 16 GB muistia, näyttis GTX 1070, jos se sitä mihinkään käyttää.

https://www.ilmaisohjelmat.fi/naps2
https://www.naps2.com/download

EDIT2: Semmoinen ihmeellinen havainto, että näkyy tekevän 300 dpi:n skannauksista melkein 8 kertaa PIENEMMÄN PDF:n kuin 96 dpi-kuvista. 50-sivuisen kirjaseni kohdalla 26,4 MB vs. 199 MB. Aivan merkillistä, ihan kuin se parsisi jonkin aivan ylettömän vektoripuuron siitä pienemmän resoluution kuvamateriaalista. Mainiotahan se vain on, jos PDF:n voi tarvittaessa tulostaakin paremmalla laadulla, sikäli kuin voi, en ole ryhtynyt kokeilemaan ainakaan vielä. Merkillistä silti.

H.
« Viimeksi muokattu: 01.05.2024 klo 20:33:27 Kirjoittaja HarO »  

Joka hetki on poikkeus - S. Paronen
Sivun alkuun
 
IP kirjattu