Tu idea sobre de almacenar todos los pdf del BOE e indexarlos con el objetivo de buscar la subvención al "colega del partido", me lleva rondando desde el mes de junio.
El problema es el almacenamiento y la posterior búsqueda, he pensado en bases de datos tipo NOSQL como Redis [google.com] o Couchdb [apache.org]
Había pensado en usar archivos de texto, con una línea por cada entrada direccionable (p.e. 20100906.xyz; titulo; texto), y luego generar en ficheros externos índices y los resultados de los filtros predeerminados. El acceso sería mediante un programa en C/C++ para minimizar el uso de memoria, y poder operar con todo en RAM sin la penalización en espacio de los SGBD (¿alguien lo ha medido?).
Re:Arrieros somos...
(Puntos:2)( http://www.loeda.es/ | Última bitácora: Sábado, 04 Agosto de 2012, 14:10h )
El problema es el almacenamiento y la posterior búsqueda, he pensado en bases de datos tipo NOSQL como Redis [google.com] o Couchdb [apache.org]
La Zapatilla Azul [loeda.es]
Et in terra pax hominibus bonæ volu
Re:Arrieros somos...
(Puntos:1)( http://www.voluntariado.net/ | Última bitácora: Domingo, 10 Junio de 2012, 21:48h )