Historias
Slashboxes
Comentarios
 
Este hilo ha sido archivado. No pueden publicarse nuevos comentarios.
Mostrar opciones Umbral:
Y recuerda: Los comentarios que siguen pertenecen a las personas que los han enviado. No somos responsables de los mismos.
  • por SergioRuiz (13221) el Miércoles, 15 Diciembre de 2004, 09:29h (#405444)

    La Universidad de Granada [www.ugr.es] en colaboración con el Banco Santander Central Hispano [gruposantander.com] está digitalizando fondo antiguo gracias a un acuerdo del 2002 [www.ugr.es]. Hay incluso un documento de 1302, los yanquis seguramente no podrán digitalizar nada propio de ese año :-).

    Ahora bien, lo que me parece una pasada es que puedan además indexar los contenidos. Supongo que la única manera es pasando un OCR a lo que se digitalice, y eso no es infalible, por lo que el proceso de corrección conlleva bastante trabajo ... ¿cómo lo harán? ¿se encargarán los animales que tienen todo el día currando (lo siento, no me acuerdo de cuáles son)?

    Yo hace poco he tenido noticia de un software (aún no tengo datos concretos) que te digitaliza un libro y te lo "limpia" para después obtener una impresión bastante decente. La idea es hacer ediciones facsímil que no se disparen de precio, pero de indexar creo que nada de nada.

    En fin, parece que este Google nos va a tener entretenidos durante unos años ... Ojalá sigan así, cuando menos es divertido.

    Puntos de inicio:    3  puntos
    Modificador extra 'Informativo'   0  

    Total marcador:   3  
  • por paradoja (6471) el Miércoles, 15 Diciembre de 2004, 12:54h (#405539)
    ( http://barrapunto.com/ )
    En la biblioteca digital [ulpgc.es] la Universidad de Las Palmas de Gran Canaria tiene digitalizados documentos propios de la universidad así como aquellos que son necesarios para investigadores, y en la Memoria digital de Canarias [ulpgc.es] tienen montones de obras acerca de las islas o por autores canarios.

    Todo se hace con un departamento propio de la biblioteca de la universidad (formado en su mayoría por becarios) desde hace unos tres años.

    --

    Fere libenter homines id quod volunt credunt.(Los hombres tienden a creer aquello que les conviene. )
    César

    [ Padre ]
  • por ferrante (2928) el Jueves, 16 Diciembre de 2004, 09:36h (#406127)
    ( http://www.germplasm.all.at/ )
    Yo suelo pasar a pdf cada documento que cae en mis manos, de esta manera, cuando voy de viaje me llevo un dvd equivalente a varios kilos de papel.
    En general, si escaneas de un original el programa de ocr no tiene problemas (excepto tablas y símbolos raros, o ecuaciones). Como me gusta que se conserve el aspecto original del documento, meto las imágenes en Acrobat y uso la función Capturar página (un ocr integrado), pero con una opción que sigue manteniendo la imagen original en primer plano y el texto `escondido' por detrás. Esto me permite hacer búsquedas y usar la opción copiar, y no importa mucho si hay errores en el ocr, porque a la hora de leerlo tengo la imagen.
    --
    --- Curiosidad + Escepticismo = Ciencia (y otras maravillas) ---
    [ Padre ]