Valitse kieli:
English
Suomi
Tervetuloa, Vieras. Ole hyvä ja
kirjaudu
tai
Rekisteröidy
Koti
Ohjeita
Haku
Kirjaudu
Rekisteröidy
Liity SRHS:n jäseneksi
SRHS Forum
›
Suomen Radiohistoriallinen Seura ry - Keskustelufoorumi
›
Yleinen keskustelualue
› OCR tekstinlukijat
‹
Edellinen aihe
|
Seuraava aihe
›
Sivu: 1
Lähetä aihe
Tulosta
OCR tekstinlukijat (Luettu 5015 kertaa)
IlpoJaakko
God Member
Poissa
SRHS
Viestejä: 837
OCR tekstinlukijat
17.08.2016 klo 10:34:00
Tulosta viesti
Kiinostaisi hankkia joku OCR-ohjelma. Esim Adobe mainostaa PDF:n käsittelyyn ohjelmaa, jossa mukana tuo tekstintunnistus.
Kuinkahan se selviää ääkkösistä. Jenkkejä ei oikein vieläkään kiinnosta nämä eurooppalaisten ihmeelliset koukerot.
Joitakin ilmaisohjelmia myös netissä, mutta käyttöliittymät ja asentaminen ei mitenkään käyttäjäystävällisiä. Eräskin aiheutti virushälytyksen, joten oli siivottava kiiereesti pois.
Pitäisi päästä edes kokeilemaan, ettei osta sikaa säkissä.
IlpJaakko
IP kirjattu
HarO
God Member
Poissa
SRHS
Viestejä: 1099
Re: OCR tekstinlukijat
Vastaus #1 -
17.08.2016 klo 15:27:14
Tulosta viesti
Ihan kevyehkönä kommenttina aiheeseen. Varmaankin kymmenen vuotta sitten käsiin tuli jostain Abbyyn Fine Reader, mahdollisesti jonkin skannerin kylkiäisenä. Se tuntui ihan vakuuttavalta ja ääkkösille oli oma lisäpakettinsa. Pari vuotta sitten viimeksi käytin ihan tuoretta OmniPagea ja täytyy sanoa, että tuotti pettymyksen, mitään kehitystä en havainnut lukutarkkuudessa tuohon vanhaan kokemukseen (ja testeihin samalla materiaalilla) verrattuna, osa dokumenteista oli ilmeisesti painojäljeltä niin pientä ja suttuista, paperi erittäin huonolaatuista, että tuloksena oli tavaraa, jonka oikoluku vei enemmän aikaa kuin kaiken kirjoittaminen uudestaan käsin. Ja kyllä, mainittu materiaali oli skannattu erinomaisen riittävällä tarkkuudella. Eli kokeilemaan todellakin pitäisi päästä ennen hankintaa.
H.
Joka hetki on poikkeus - S. Paronen
IP kirjattu
IlpoJaakko
God Member
Poissa
SRHS
Viestejä: 837
Re: OCR tekstinlukijat
Vastaus #2 -
18.08.2016 klo 20:06:42
Tulosta viesti
Adobe Acrobat Pro x ladattu. Kokeiluversio 7:n päivän ajan. Yllättävän nopea, vain muutama sekunti/sivu. Käyttis Win 10. Jälki myös kelvollista. Käsikirjassa 505 sivua, joten ei varmaan opi koskaan sen kaikkia temppuja.
IP kirjattu
RistoKoo
Full Member
Poissa
SRHS
Viestejä: 169
Re: OCR tekstinlukijat
Vastaus #3 -
19.08.2016 klo 07:25:57
Tulosta viesti
Täältä löytyy myös kokeiluversio OCR-ohjelmasta:
http://www.irislink.com/c2-983-60/IRIS---The-World-leader-in-OCR--PDF-and-Portab...
IP kirjattu
HarO
God Member
Poissa
SRHS
Viestejä: 1099
Re: OCR tekstinlukijat
Vastaus #4 -
19.08.2016 klo 14:15:47
Tulosta viesti
Pitää tuo Iriskin ehtiessä kokeilla, vaikka epäilenkin, ettei se Omnipagea päihitä, eli edelleen jää aineistoni kuvamuotoiseksi. Kun nyt edes sisällysluettelot (esimerkiksi) noista saisi tekstiksi. Kotiseutukuvauksia Lounais-Hämeestä on tuo mainittu julkaisusarja. Toki edistyneitä softia voi opettaa, mutta kenellä siihen on oikeasti aikaa ja pinnaa!
H.
Joka hetki on poikkeus - S. Paronen
IP kirjattu
VjpA
God Member
Poissa
SRHS
Viestejä: 2497
Sijainti: Vantaa
Re: OCR tekstinlukijat
Vastaus #5 -
20.08.2016 klo 23:06:15
Tulosta viesti
Mulla ei ole Linuksissa Adobea, mutta .pdf tiedostot aukeaa Okular-nimisellä katselimella. Siinä on sellainen ominaisuus; kun maalaat hiirellä jonkun alueen tiedostosta - voit valita kopiotko tekstinä vai kuvana ja liität sen (tekstin) LibreOffice tekstinkäsittely dokkiin, niin siinä on sitten teksti oletusfontilla jatkokäsittelyä varten.
Ainakin Canonin skanneri-printtereissä tuli ennen OCR- ohjelma mukana (Win - Mac) ja sillä sai kyllä kuvasta tekstit luettua, vaan jos kuvassa oli/on vähän pikseleita lukijalla on vaikeuksia sekä jos fontti on vanhaa (esim. ennen WW II) tulee lukuvirheitä.
Kopioin vanhoista urheilulehdistä (1901 - 1904) juttua 240 pikseli kuviin, aika paljon joutui tekstiä editoimaan.
Linux:iin en ole vielä asentanut ko- ohjelmaa - niitä kyllä löytyy.
t. // Jukka
IP kirjattu
IlpoJaakko
God Member
Poissa
SRHS
Viestejä: 837
Re: OCR tekstinlukijat
Vastaus #6 -
22.08.2016 klo 13:10:54
Tulosta viesti
Kokeilen juuri tuota RistoKoon antamaa linkkiä Readiris 15.
Katselin tarkemmin tuota Adoben OCR-ohjelmaa. Sen voi kyllä unohtaa, koska hinnan lisäksi tulisi vuosimaksukin.
Nyt kokeilen toista, Canonin Readiris15, jolta hain 10 päivän kokeiluversion. Hinta 79 €, eikä muita maksuja(?). Se tekee tekstiä myös kuvatiedostoista jpeg, Tiff ym. Ei tarvitse kaikkea skannata ensin PDF:ksi. Tuntuu toimivan ihan ok. Siis Adobeen verrattuna kätevämpi.
Lisäksi siinä myös PDF-tiedostojen muokkausmahdollisuus. Tutkin onnistuuko se, kun joissakin PDF:ssä on laitettu suojauksena muokkauskielto.
IP kirjattu
RJL
God Member
Poissa
SRHS 612
Viestejä: 2652
Re: OCR tekstinlukijat
Vastaus #7 -
22.08.2016 klo 13:34:54
Tulosta viesti
Muokkauskiellon voi poistaa tällä sivulla:
http://www.pdfunlock.com/
Pdf vaan lähetetään sinne ja takaisin omalle tietsikalle tulee avattu pdf.
Reijo Liljedahl - SRHS 612 - OH3AVA - SDXL 8092
IP kirjattu
HarO
God Member
Poissa
SRHS
Viestejä: 1099
Re: OCR tekstinlukijat
Vastaus #8 -
01.05.2024 klo 16:17:10
Tulosta viesti
Mainitaan tähänkin vielä, että hiljattain havaitun perusteella NAPS2 toimii ihan hyvin, ainakin jos raakamateriaali on säädyllisen selkeätä. Itse tein juuri pienen kirjasen skannatuista sivuista nk. haettavan PDF:n ilman ongelmia. Suomen kieli tuettu siis myös, mitään asennuksiakaan ei väkisin tarvita, portable-paketista purku hakemistoon. Ilmaisohjelmien arvostelussa miinusta on annettu hitaalle OCR-toiminnolle, mutta en kyllä huomannut minkäänlaista ongelmaa tässä noin 50 sivun kirjasessa, jossa pieni määrä kuvia - valmis alle (EDIT:) 15 sekunnissa. Uskoisin skaalautuvan aika lineaarisesti laajempiinkin teoksiin. Vehje Ryzen 5 3600 ja 16 GB muistia, näyttis GTX 1070, jos se sitä mihinkään käyttää.
https://www.ilmaisohjelmat.fi/naps2
https://www.naps2.com/download
EDIT2: Semmoinen ihmeellinen havainto, että näkyy tekevän 300 dpi:n skannauksista melkein 8 kertaa PIENEMMÄN PDF:n kuin 96 dpi-kuvista. 50-sivuisen kirjaseni kohdalla 26,4 MB vs. 199 MB. Aivan merkillistä, ihan kuin se parsisi jonkin aivan ylettömän vektoripuuron siitä pienemmän resoluution kuvamateriaalista. Mainiotahan se vain on, jos PDF:n voi tarvittaessa tulostaakin paremmalla laadulla, sikäli kuin voi, en ole ryhtynyt kokeilemaan ainakaan vielä. Merkillistä silti.
H.
«
Viimeksi muokattu: 01.05.2024 klo 20:33:27 Kirjoittaja HarO
»
Joka hetki on poikkeus - S. Paronen
IP kirjattu
Sivu: 1
Lähetä aihe
Tulosta
‹
Edellinen aihe
|
Seuraava aihe
›
Foorumihyppy »
Koti
» 10 viimeisintä viestiä
» 10 viimeisintä aihetta
Suomen Radiohistoriallinen Seura ry - Keskustelufoorumi
Suomen Radiohistoriallinen Seura ry
Jäsenalue
Yleistä radiohistoriasta
Kotimaiset radiot, televisiot ja äänentoistolaitteet
Ulkomaiset radiot, televisiot ja äänentoistolaitteet
Muut radio- ja elektroniikkalaitteet
Entisöinti ja kunnostus yleisellä tasolla
Omatekoiset laitteet ja rakentelu
Sotilasradiot ja Perinneradiot
Yleinen keskustelualue ««
Niitä Näitä
Haku päällä
« Koti
‹ Alue
SRHS Forum
» Powered by
YaBB 2.6.12
!
YaBB Forum Software
© 2000-2024. Kaikki oikeudet pidätetään.