Google hace open source un soft OCR

149 meneos

Google hace open source un soft OCR

En inglés. Tesseract OCR, un soft de OCR desarrollado por los laboratorios de HP entre 1985 y 1995, ha sido retomado por Google que ha corregido algunos bugs importantes, y lo ha publicado en sourceforge bajo una licencia libre. No es apto para documentos demasiado complejos, y sólo funciona en inglés, pero en Google afirman que es el OCR open source más preciso existente en la actualidad. Como dato adicional, la entrada dice que en Google buscan buenos ingenieros OCR (para contratarlos).

149 0 0 K 633 mnm

12 comentarios

149 0 0 K 633 mnm

#1 Polmac

Qué manía de copiar la costumbre yanki de decirlo todo en siglas... que levante la mano el que supiera qué es OCR antes de ver el contenido del enlace. Alguno se las dará de guay diciendo que lo sabía, pero la mayoría creo que no, así que por favor... si algo no es MUY conocido, ¡¡siglas no!!

Por cierto, ya que estoy, significa Optical Character Recognition, osea, reconocimiento óptico de caracteres.

0 6
#2 --422--

Pues que quieres que te diga, pero hace mucho tiempo (año 95-98) el tema de usar OCR para escanear libros y enciclopedias era algo "habitual" para hacer "trabajos del cole, instituto y universidad" Claro está... en el 97-98 un módem a 33.600 lo cambió todo

0 6
#3 acastro

Exacto. Ahora para ciertos usos basta con archivar la imagen de documento sin pasarlo a texto, porque uno de los motivos para hacer tal cosa era el ahorro de espacio, pero lógicamente un OCR continua siendo realmente interesante en muchas situaciones. ¿Como haces para buscar palabra en una imagen de un documento?

0 9
#4 kNo

#1 Que tu lo ignores no significa que los demás también. Las siglas OCR son conocidas por casi cualquier persona que haya tenido alguna vez un scanner, ya que la mayoría de los programas están en inglés. No nos culpes de tu ignorancia.

0 7
#5 --2030--

» ver comentario
#6 --8552--

#1, yo lo sabía, y tal y como dice #4 todos los que hemos tenido/tenemos escáner lo conocemos

0 6
#7 arcangel2p

#1. Yo tb lo sabía.
Además yo pienso que es muy útil una herramienta de OCR para libros de texto, novelas ...etc. Me imagino que todo esto debe ir ligado con el Google Books.

0 6
#8 chipword

yo le veo util para aplicaciones de archivo documental. los que hay hasta ahora .. clara etc de opensource dejan mucho que desear.. espero que tenga soperte de castellano.. pronto

0 6
#9 pdp

Pero en la licencia pone esto acerca de una parte del código:

We require a brief acknowledgement in any research
paper or other publication where this software has made a significant
contribution. If you wish to use it for commercial gain you must contact
The MITRE Corporation for conditions of use.

Esto no es entonces del todo libre, ¿no? Aunque el resto está bajo la licencia Apache.

0 6
#10 Polmac

#4 Me parece un poquito prepotente llamarme ignorante por no saber algo que el 99% de la población española desconoce. Me acabo de inventar el dato, pero te animo a que hagas un sondeo entre tus conocidos, a ser posible entre gente "normal", tú ya me entiendes.

Buenos días.

0 6
#11 --8552--

#9, que no sea gratis para uso comercial no quiere decir que no sea libre... ¿cuántas veces tenemos que decir que libre no es igual a gratis?

Y #10, tu actitud sí que es prepotente, porque mínimo la cuarta parte de la gente sabe lo que es un OCR... al menos en mi pueblo (porque hasta mi padre sabe lo que es un OCR, y eso que se trata de un negado en la informática). Si tú no lo sabes, no dés por hecho que casi nadie lo sabe

0 6
#12 Polmac

#11 OK, mis disculpas entonces, seré yo el equivocado. Pero sigue sin estar de más poner el significado de las siglas en la noticia

0 6

comentarios cerrados

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

más visitadas

Si piensas comprar un coche eléctrico, olvídate de estos bulos (1ª parte)

Gonzalo Miró desmiente en directo a Susana Griso cuando esta intenta responsabilizar a Pablo Iglesias de la muerte de los ancianos en las residencias

El feroz castigo que reservaba el Imperio español para combatir a los vagos y maleantes

Detienen a un influencer con 4.600 móviles en casa, que usaba para trucar sus streamings

Imágenes aéreas captan a la ciudad de Porto Alegre bajo el agua

más votadas

El PP señala que las manifestaciones de estudiantes en apoyo al pueblo palestino son en realidad "a favor de Hamás"

El Constitucional rechaza el recurso de Vox y avala que el acoso a mujeres que abortan sea delito

Israel detruye la aldea beduina de Wadi Khalil en el Negev dejando a sus residentes sin techo [EN]

La plataforma X eliminó la cuenta de Maher Musalli después de hacer este brillante video sobre el genocidio de Gaza

'Todo es mentira' afirma luchar contra la desinformación pero sigue llevando a Esperanza Aguirre

suscripciones por RSS

Google hace open source un soft OCR