Login Barrapunto
Google publica un OCR de código abierto
Sergiodf nos cuenta: «A través de OSNews me entero de que Google hace unos meses lanzó como código abierto Tesseract, un software de OCR que ahora re-lanza. En la noticia en su blog, Google dice que es el mejor de los OCR open source.» Al parecer, fue desarrollado originalmente por los laboratorios de HP entre 1985 y 1995.
Historias relacionadas
[+]
Google impulsa un OCR de código abierto 20 comentarios
xomoxo nos cuenta: «Google va a patrocinar el desarrollo de un OCR Open Source (traducción). El proyecto tiene como objetivos avanzar en el reconocimiento óptico de caracteres y tecnologías relacionadas para ofrecer un sistema OCR de alta calidad que permita usarlo para la conversión de documentos, para crear librerías electrónicas, ofrecer un mejor soporte para disminuidos ópticos, en análisis de documentos históricos y para el uso de escritorio en general.»
Este hilo ha sido archivado.
No pueden publicarse nuevos comentarios.
Y recuerda: Los comentarios que siguen pertenecen a las personas que los han enviado. No somos responsables de los mismos.

Me parece una gran noticia
(Puntos:2)( http://vidaartificial.com/blog | Última bitácora: Miércoles, 10 Octubre de 2007, 20:48h )
Aunque mejoraría mucho con un analizador de la distribución del texto. Y por pedir que no solo separara el texto en columnas, sino que además pudiera extraer las imágenes.
Existen muchos libros anteriores a 1900 que ya son de dominio público y que podrían resultar interesantes tanto como lectura lúdica como para la investigaición histórica.
Mi blog: Vida Artificial [vidaartificial.com]
escanear texto escrito
(Puntos:1)( http://apuntes.infonotas.com/ )
Mucha gente ha optado por no usarla ya que al final se podría requerir un nivel de esfuerzo parecido al que tendría que usarse en caso de tipear directamente el texto, ya que para lograr buenos resultados se requiere que el impreso a escanear sea de óptima calidad.
Para el tipeo de textos escritos de baja calidad existe una interesante alternativa que es la conversión de voz a texto. Aunque no la he usado me han dicho que los requerimientos de hardware son muy grandes.
En todo caso, si existe un experto en el escaneo de textos ese es Google y lo ha demostrado con el escaneo de miles de libros para su base de datos (para más información visiten books.google.com [barrapunto.com])
________________________________________
Nunca visites ese sitio [infonotas.com]
Es tan güeno...
(Puntos:2)( http://barrapunto.com/ )
Si no puedes deslumbrar con tu sabiduría, desconcierta con tus gilipolleces.
Bien por Google
(Puntos:1)( http://usuarios.lycos.es/ernestus/ | Última bitácora: Miércoles, 16 Julio de 2008, 11:57h )
Las companyas estan para hacer dinero, eso ya lo se, pero parecen que los de Google ganan dinero y hacen lo que les gusta.
Bueno, era solo eso.
E
.
.
.
Re:No tiene nada que ver pero lo comento.
(Puntos:5, Inspirado)( http://barrapunto.com/ )
Para conseguir ese objetivo necesitarias una inteligencia artificial muy avanzada. Perdon, una inteligencia artificial muy, muy, pero que muy avanzada.
La comprension de un texto se basa en muchisimos factores, entre los cuales hay factores visuales, linguisticos, historicos, culturales, etc. La lectura de un texto va mas alla de la simple grafia, necesita interpretacion. Y para interpretar es necesario tener inteligencia.
Los sistemas de traduccion automatica son horribles porque no tienen el factor de interpretacion. Solo saben convertir palabras en palabras o frases en frases, es decir, son muy basicos.
Pides un grado de inteligencia artificial con el cual hoy en dia solo podemos soñar, y cuando soñamos con ello generalmente nos da miedo.
Saludos.
Re:abierto o libre?
(Puntos:1, Informativo)Aquí tienes la licencia:
COPYING [sourceforge.net]
También tiene una dependencia de un componente semilibre (no se permite uso comercial), pero el programa en sí es libre.
Saludos...
Re:Reconocedor de código de barras
(Puntos:1)( Última bitácora: Sábado, 15 Julio de 2006, 00:41h )
He encontrado jbarcode-scan [sourceforge.net] readbarcode [sourceforge.net] barcold [sourceforge.net]. Pero, por lo que leo, ninguno está acabado.