Software OCR gratuiti direttamente online

Qui si parla di computer, internet, software e le problematiche legate ad essi.
Rispondi
Avatar utente
Barrnet
Amministratore
Amministratore
Messaggi: 14332
Iscritto il: domenica 24 gennaio 2010, 23:02
Sesso: Maschio
Località: Bergamo
Contatta:

Software OCR gratuiti direttamente online

Messaggio da Barrnet »

Come sapete sono una persona molto pigra. Piuttosto che ricopiarmi a mano del testo da delle immagini scannerizzate comincio a cercare una fonte alternativa da cui leggere e salvarmi tale testo.
Ma che accade se quelle immagini sono l'unica fonte di tale testo? In aiuto vengono i Software OCR, ovvero software preposti per l'estrazione del testo da delle immagini, più o meno lo stesso principio che viene utilizzato per creare spam-bot in grado di compilare correttamente dei codici Captcha.
Logicamente se non scannerizzate ogni giorno testi da cui estrarne il contenuto installarvi un programma apposito è pressoché dannoso per la salute del registro di sistema della vostra povera installazione di Windows.
Che fare quindi? rinunciare? no, meglio affidarsi alla pigrizia estrema di Barrnet che pur di non ricopiarsi 2 righe a mano ha cercato con google la migliore soluzione: un sito OCR gratuito online!
Ne ho trovati ben due.

Il primo si chiama Free OCR, presenta una grafica piuttosto spartana ed è munito di un semplice Re Captcha.
Permette il caricamento di PDF o immagini fino a 2 mega e supporta tante lingue, tra cui l'italiano. Nelle mie prove ho rilevato che il testo estratto spesso è praticamente esatto (salvo qualche carattere scambiato per un altro, specie se l'immagine ha uno sfondo non in tinta unita) ma purtroppo va in "palla" ad analizzare le tabelle, restituendo il testo piuttosto confuso. Vi è un limite di 10 immagini per ora dalla stessa sessione ma il servizio non richiede alcuna registrazione.

Il secondo si chiama Online OCR è simile al precedente, supporta 32 lingue e permette di caricare fino a 15 immagini per ora gratuitamente e senza iscrizione, supporta l'iscrizione al servizio per ottenere qualche vantaggio. Il supporto ai PDF è a pagamento ma ha un supporto decisamente migliore: per esempio è possibile estrarre il testo solo da alcune pagine di tutto il PDF.
Inoltre Online OCR supporta meglio l'estrazione di testo da parte di tabelle, elenchi e altri elementi di intabulazione del testo, restituendo quasi sempre un testo completo e ben formattato. Il sito supporta in output (ovvero il formato in cui viene restituito il testo) 3 formati: .doc (World), .xls (Excel) o .txt (puro testo) e nelle mie prove non mi è ancora capitato di ricevere un testo illeggibile.
Immagine
Rispondi

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite