Historias
Slashboxes
Comentarios

Google publica un OCR de código abierto

editada por Yonderboy el 01 de Septiembre 2006, 10:54h   Printer-friendly   Email story
desde el dept. anuncios
Sergiodf nos cuenta: «A través de OSNews me entero de que Google hace unos meses lanzó como código abierto Tesseract, un software de OCR que ahora re-lanza. En la noticia en su blog, Google dice que es el mejor de los OCR open source.» Al parecer, fue desarrollado originalmente por los laboratorios de HP entre 1985 y 1995.

Historias relacionadas

[+] Google impulsa un OCR de código abierto 20 comentarios
xomoxo nos cuenta: «Google va a patrocinar el desarrollo de un OCR Open Source (traducción). El proyecto tiene como objetivos avanzar en el reconocimiento óptico de caracteres y tecnologías relacionadas para ofrecer un sistema OCR de alta calidad que permita usarlo para la conversión de documentos, para crear librerías electrónicas, ofrecer un mejor soporte para disminuidos ópticos, en análisis de documentos históricos y para el uso de escritorio en general.»
Este hilo ha sido archivado. No pueden publicarse nuevos comentarios.
Mostrar opciones Umbral:
Y recuerda: Los comentarios que siguen pertenecen a las personas que los han enviado. No somos responsables de los mismos.
  • por YearOfTheDragon (5071) el Viernes, 01 Septiembre de 2006, 11:42h (#804075)
    ( http://vidaartificial.com/blog | Última bitácora: Miércoles, 10 Octubre de 2007, 20:48h )
    Puede representar un nuevo impulso a Wikisource [wikisource.org].
    Aunque mejoraría mucho con un analizador de la distribución del texto. Y por pedir que no solo separara el texto en columnas, sino que además pudiera extraer las imágenes.

    Existen muchos libros anteriores a 1900 que ya son de dominio público y que podrían resultar interesantes tanto como lectura lúdica como para la investigaición histórica.
    --
    Mi blog: Vida Artificial [vidaartificial.com]
  • por bregador (26353) el Viernes, 01 Septiembre de 2006, 12:10h (#804091)
    ( http://apuntes.infonotas.com/ )
    El reconocimiento óptico de caractéres es uns tecnología que en ocasiones puede ser frustante.

    Mucha gente ha optado por no usarla ya que al final se podría requerir un nivel de esfuerzo parecido al que tendría que usarse en caso de tipear directamente el texto, ya que para lograr buenos resultados se requiere que el impreso a escanear sea de óptima calidad.

    Para el tipeo de textos escritos de baja calidad existe una interesante alternativa que es la conversión de voz a texto. Aunque no la he usado me han dicho que los requerimientos de hardware son muy grandes.

    En todo caso, si existe un experto en el escaneo de textos ese es Google y lo ha demostrado con el escaneo de miles de libros para su base de datos (para más información visiten books.google.com [barrapunto.com])
    --


    ________________________________________
    Nunca visites ese sitio [infonotas.com]
  • Es tan güeno...

    (Puntos:2)
    por Taylor (290) el Viernes, 01 Septiembre de 2006, 12:52h (#804132)
    ( http://barrapunto.com/ )
    ...que resuelve captchas.
    --
    Si no puedes deslumbrar con tu sabiduría, desconcierta con tus gilipolleces.
  • Bien por Google

    (Puntos:1)
    por rongorongo (23587) el Viernes, 01 Septiembre de 2006, 14:03h (#804202)
    ( http://usuarios.lycos.es/ernestus/ | Última bitácora: Miércoles, 16 Julio de 2008, 11:57h )
    Parece que Google siguie con su politica de "buen rollito" con el software libre. He de reconocer que al principio pense que era todo propaganda, pero cada dia me demuestran lo contrario (bueno, he de reconocer que tambien lo hacen por publicidad).

    Las companyas estan para hacer dinero, eso ya lo se, pero parecen que los de Google ganan dinero y hacen lo que les gusta.

    Bueno, era solo eso.

    E
    .
    .
    .
  • por sorrill (13858) el Viernes, 01 Septiembre de 2006, 13:09h (#804157)
    ( http://barrapunto.com/ )
    sino que pueden ayudarnos a leer textos que hoy en dia nos es dificil entender

    Para conseguir ese objetivo necesitarias una inteligencia artificial muy avanzada. Perdon, una inteligencia artificial muy, muy, pero que muy avanzada.

    La comprension de un texto se basa en muchisimos factores, entre los cuales hay factores visuales, linguisticos, historicos, culturales, etc. La lectura de un texto va mas alla de la simple grafia, necesita interpretacion. Y para interpretar es necesario tener inteligencia.

    Los sistemas de traduccion automatica son horribles porque no tienen el factor de interpretacion. Solo saben convertir palabras en palabras o frases en frases, es decir, son muy basicos.

    Pides un grado de inteligencia artificial con el cual hoy en dia solo podemos soñar, y cuando soñamos con ello generalmente nos da miedo.

    Saludos.
    [ Padre ]
  • Re:abierto o libre?

    (Puntos:1, Informativo)
    por pobrecito hablador el Viernes, 01 Septiembre de 2006, 15:12h (#804253)
    Pues es libre, licenciado bajo la licencia Apache 2.0.

    Aquí tienes la licencia:
    COPYING [sourceforge.net]

    También tiene una dependencia de un componente semilibre (no se permite uso comercial), pero el programa en sí es libre.

    Saludos...
    [ Padre ]
  • por danisan (21540) el Sábado, 02 Septiembre de 2006, 11:00h (#804595)
    ( Última bitácora: Sábado, 15 Julio de 2006, 00:41h )
    ¿Sabeis de algún OCR libre que reconozca código de barras? Util en encuestas, impresos médicos, documentación de almacén,...

    He encontrado jbarcode-scan [sourceforge.net] readbarcode [sourceforge.net] barcold [sourceforge.net]. Pero, por lo que leo, ninguno está acabado.
    [ Padre ]
  • 6 respuestas por debajo de tu umbral de lectura actual.