Historias
Slashboxes
Comentarios
 

Buscador de Wikipedia en español

editada por rvr el 12 de Mayo 2007, 19:41h   Printer-friendly   Email story
desde el dept. max-mix-3
mod_conf cuenta en su bitácora: «Desde hace algún tiempo, estaba pensando en hacer un buscador que indizara una gran cantidad de texto para comprobar que problemas reales se tienen cuando se trata con cantidades ingentes de información. Para ello había dos opciones, escoger una base de datos con muchos registros o escoger una con menos registros pero si una cantidad grande de texto por cada uno de ellos. Dejo el enlace al buscador y al post del proceso de creación: Buscador de la Wikipedia y Buscador para la Wikipedia (jugando con sphinx)».

Historias relacionadas

[+] 'Stemmer' español, liberado para searchpedia 4 comentarios
Hace algún tiempo se mostró cómo realizar un buscador de texto completo con la base de datos de la wikipedia. Éste, se realizó con Apache+PHP+MySQL y SPHINX. Ahora he liberado un stemmer (buscador de raíces de palabras) para el idioma español para SPHINX. Está basado en el algoritmo de Porter. Se puede probar en el buscador de la wikipedia, o en AgregaX (llevado a cabo por Pau Iglesias). Más detalles y descarga en: Stemmer en castellano para SPHINX.
Este hilo ha sido archivado. No pueden publicarse nuevos comentarios.
Mostrar opciones Umbral:
Y recuerda: Los comentarios que siguen pertenecen a las personas que los han enviado. No somos responsables de los mismos.