En inglés. Tesseract OCR, un soft de OCR desarrollado por los laboratorios de HP entre 1985 y 1995, ha sido retomado por Google que ha corregido algunos bugs importantes, y lo ha publicado en sourceforge bajo una licencia libre. No es apto para documentos demasiado complejos, y sólo funciona en inglés, pero en Google afirman que es el OCR open source más preciso existente en la actualidad. Como dato adicional, la entrada dice que en Google buscan buenos ingenieros OCR (para contratarlos).
|
etiquetas: software libre , google , ocr , hp